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Beschreibung 

[0001] Die Erfindung betrifft eine Cholesterinoxidase aus Brevibacterium sterolicum, ein Verfahren zur Herstellung 
einer rekombinanten Cholesterinoxidase aus Brevibacterium sterolicum, eine fur dieses Verfahren geeignete DNA-Se- 
5 quenz, welche eine zytoplasmatische Expression der rekombinanten Cholesterinoxidase im Wirtsbakterium bewirkt, 
sowie die so erhaltliche rekombinante Cholesterinoxidase. 

[0002] Fur die enzymatische Bestimmung von Cholesterin ist die Cholesterinoxidase von grofter Bedeutung. Sie 
katalysiert die Oxidation von Cholesterin zu Cholesten-3-on und H 2 0 2 . Cholesterinoxidase aus verschiedenen Orga- 
nismen wie Pseudomonas, Mycobacterium, Nocardia, Arthrobacter und Brevibacterium sind bereits beschrieben worden 

10 (T. Uwajima et al., Agr. Biol. Chem. 37 (1973), 2345 - 2350). Alle diese bekannten Cholesterinoxidasen sind sezernierte 
Proteine. Das Bodenbakterium Brevibacterium sterolicum KY 3643 (ATCC 21387) zeigt eine besonders hohe Aktivitat 
der Cholesterinoxidase. Aus diesem Bakterium sind drei Isoenzyme der Cholesterinoxidase bekannt, die sich in ihrem 
isoelektrischen Punkt, der Substratspezifitat gegenuber verschiedenen Steroiden, der Affinitat gegenuber Cholesterin 
im pH-Optimum und der DNA bzw. Aminosauresequenz unterscheiden (EP-A 0 452 112 und EP-A 560 983). Die 

15 Cholesterinoxidase I aus Brevibacterium sterolicum zeigt eine geringe Affinitat zu Cholesterin (K^ 1,1 x 10 -3 mol/l) und 
ist aus Brevibacterium sterolicum nur in geringer Ausbeute erhaltlich. Die Expression einer kompletten fur die Chole- 
sterinoxidase I kodierenden DNA in E. coli wurde bereits versucht, ist jedoch bislang nicht gelungen (K. Fujishiro et al., 
Biochem. Biophys. Res. Com. 172 (1990), 721 - 727, T. Ohta et al., Gene 103 (1991), 93 - 96). Auch die Expression 
spezieller Deletionsmutanten der fur die Cholesterinoxidase I kodierenden DNA, welche mit Teilen des lac z Gens 

20 fusioniert wurden, fuhrte zu keiner befriedigenden Expression in E. coli (T. Ohta et al., Biosci. Biotech. Biochem. 56 
(1992), 1786 - 1791). In der EP-A 0 452 1 12 wird die Klonierung und Expression von weiteren Cholesterinoxidasen aus 
Brevibacterium sterolicum beschrieben. Die Expression dieser DNAs fuhrt jedoch ebenfalls nicht zu einer ausreichenden 
Menge an aktiver Cholesterinoxidase. 

[0003] Aufgabe der Erfindung war es, eine Cholesterinoxidase mit hoher Affinitat zu Cholesterin in groften Mengen 
25 und in aktiver Form zur Verfugung zu stellen. 

[0004] Diese Aufgabe wird gelost durch eine Cholesterinoxidase, welche die in SEQ ID NO 2 gezeigte Aminosaure- 
sequenz aufweist. Diese Cholesterinoxidase ist aus Brevibacterium sterolicum erhaltlich oder auch rekombinant her- 
stellbar. 

[0005] Es hat sich uberraschenderweise gezeigt, dafJ eine derartige Cholesterinoxidase rekombinant in grofier Menge 
30 und in aktiver Form hergestellt werden kann. Diese Cholesterinoxidase weist ein Molekulargewicht von 60 kD, einen 
isoelektrischen Punkt von ca. 5,5 (jeweils gemessen im Phast-System, Pharmacia-LKB) sowie einen l^-Wertfur Cho- 
lesterin von 1x10^ mol/l (in 0,5 mol/l Kaliumphosphatpuffer pH 7,5 bei 25°C) auf und ist in einem pH-Beretch von 5,5 
bis 8,0 wirksam. 

[0006] Es hat sich gezeigt, daft diese Cholesterinoxidase in grower Menge in aktiver Form erhalten werden kann, 
35 wenn fur eine heterologe Expression eine DNA verwendet wird, welche fur ein Peptid mit Cholesterinoxidase-Aktivitat 
kodiert mit der in SEQ ID NO 1 gezeigten DNA-Sequenz oder der dazu komplementaren DNA-Sequenz. 
[0007] Vorzugsweise wird eine DNA verwendet, welche die in SEQ ID NO 1 gezeigte Sequenz aufweist. In dem 
Fachmann gelaufiger Weise kbnnen jedoch degenerierte Codons durch andere Codons, welche fur die gleiche Amino- 
saure kodieren, ersetzt werden. Zusatzlich soil die verwendete DNA eine der in SEQ ID NO 3, 4 und/oder 5 gezeigten 
40 DNA-Sequenzen aufweisen und fur ein Peptid mit Cholesterinoxidase-Aktivitat kodieren. Unter einem Peptid mit Cho- 
lesterinoxidase-Aktivitat ist ein solches Peptid zu verstehen, welches die Oxidation von Cholesterin (5-Cholesten-3-fJ-ol) 
zu 4-Cholesten-3-on und H 2 0 2 katalysiert. 

[0008] Ein weiterer Gegenstand der Erfindung ist daher eine DNA, welche fur ein Peptid mit Cholesterinoxidase-Ak- 
tivitat kodiert mit der in SEQ ID NO 1 gezeigten DNA-Sequenz oder der dazu komplementaren DNA-Sequenz. 

45 [0009] Mit einer solchen DNA kann eine mindestens 1 0fach hohere Aktivitat der rekombinant hergestellten Choleste- 
rinoxidase im Rohextrakt erhalten werden als mit den bislang beschriebenen Verfahren und Cholesterinoxidasen. 
[0010] Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Herstellung einer rekombinanten Cholesterinoxi- 
dase durch Transformation einer geeigneten Wirtszelle mit einer erfindungsgemafien DNA, welche in einem geeigneten 
Expressionssystem vorliegt, Kultivierung der transformierten Wirtszellen und Isolierung der gebildeten Cholesterinoxi- 

50 dase aus dem Zytoplasma der transformierten Zellen. 

[0011] Mit diesem Verfahren ist es uberraschenderweise moglich, eine rekombinante Cholesterinoxidase in grofier 
Menge und aktiver Form aus dem Zytoplasma der transformierten Wirtszelle zu erhalten. Dabei kann die verwendete 
DNA am 5'-Ende eine zusatzliche Nukieotidsequenz enthalten, die ein Translations-Startcodon, jedoch kein Stopcodon 
aufweist, wobei diese zusatzliche Nukieotidsequenz nicht zu einer Leserasterverschiebung fuhrt und keine fur die Se- 

55 kretion des gebildeten rekombinanten Enzyms funktionell aktive Signalsequenz darstellt. Die Lange dieser Nukieotid- 
sequenz betragt etwa 3 bis 90 Basenpaare. 

[0012] Vorzugsweise weist die zusatzliche Nukieotidsequenz eine der in den Sequenzprotokollen 6, 8, 10, 12, 14 und 
16 gezeigten Sequenzen anstelle der nativen Signalsequenz auf. 
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[0013] Ein bevorzugter Gegenstand der Erfindung ist daher ein Verfahren zur Herstellung einer rekombinanten Cho- 
lesterinoxidase, wobei eine erfindungsgemafie DNA verwendet wird, welche am S'-Ende eine der in SEQ ID NO 6, 8, 
10, 12, 14 Oder 16 gezeigten Sequenzen aufweist. 

[0014] Die Transformation der fur die rekombinante Herstellung verwendeten Wirtszellen erfolgt nach bekannten 
5 Verfahren (siehe z.B. Sambrook, Fritsch und Maniatis, "Molecular Cloning, A Laboratory Manual", Cold Spring Harbor 
Laboratory Press, Cold Spring Harbor 1 989). Die transformierten Wirtszellen werden dann unter Bedingungen kultiviert, 
die eine Expression des Cholesterinoxidase-Gens eriauben. Je nach dem verwendeten Expressionsvektor ist hierfur in 
bekannter Weise gegebenenfalls die Zugabe eines Induktors (z.B. Lactose oder lsopropyl-|3-D-thiogalactopyranosid 
(IPTG)) zum Kulturmedium, eine Temperaturerhohung oder eine limitierte Glucosezufuhr zweckmafiig. Die Isolierung 
10 der rekombinanten Cholesterinoxidase aus dem Zytoplasma der transformierten Zellen erfolgt dann nach bekannten 
Verfahren. 

[0015] Mit diesem Verfahren ist es moglich, die erfindungsgemafie Cholesterinoxidase als rekombinantes Enzym in 
einer Ausbeute von 8 - 20 U/ml zu erhalten. Die Expression des vollstandigen Cholesterinoxidase-Gens, welches die 
Signalsequenz enthalt, ergibt dagegen lediglich eine Ausbeute von unter 0,1 U/ml. 

15 [0016] Ein bevorzugter Gegenstand der Erfindung ist eine erfindungsgemafie, fur ein Peptid mit Cholesterinoxida- 
se-Aktivitat kodierende DNA, welche am 5'-Ende eine der in SEQ ID NO 6, 8, 10, 12, 14 und 16 gezeigten Sequenzen 
aufweist. Besonders bevorzugt sind die in den Sequenzprotokollen 18, 20, 22, 24, 26 und 29 gezeigten Sequenzen. 
Vorzugsweise iiegen diese erfindungsgemalien DNA-Sequenzen in einem Expressionsvektor kloniert vor. Mit Hilfe 
dieser DNA kann die erfindungsgemalie Cholesterinoxidase in beliebigen Mengen in den fur die rekombinante Herstei- 

20 lung von Proteinen ublicherweise verwendeten Bakterien gewonnen werden. Vorzugsweise erfolgt die Expression in E. 
coli. 

[0017] Ein weiterer Gegenstand der Erfindung ist daher eine rekombinante Cholesterinoxidase, welche von einer 
erfindungsgemafien DNA kodiert wird und am N-terminalen Ende eine der in SEQ ID NO 7, 9, 11, 13, 15 oder 17 
gezeigten Aminosauresequenzen aufweist. 

25 [0018] Diese rekombinante Cholesterinoxidase ist fur einen enzymatischen Test zur Bestimmung von Cholesterin 
ebenso geeignet wie die ubrigen aus dem Stand der Technik bekannten Cholesterinoxidasen. Falls erforderlich konnen 
in dem Fachmann gelaufiger Weise durch in-vitro-Mutagenese zwischen diesen N-terminalen Sequenzen und der Ami- 
nosauresequenz der reifen Cholesterin-oxidase Erkennungssequenzen fur spezifische Proteasen wie z.B. der IgA-Pro- 
tease, der Enterokinase oder des Faktors Xa integriert werden, so dali auch nach der zytoplasmatischen Expression 

30 der urn diese N-terminalen Sequenzen verlangerten Cholesterinoxidase eine Abspaltung solcher anfusionierter N-ter- 
minaler Sequenzen moglich ist. 

[0019] Ein bevorzugter Gegenstand der Erfindung ist eine rekombinante Cholesterinoxidase, welche die in SEQ ID 
NO 21 , 23, 25, 27 oder 29 gezeigte Aminosauresequenz aufweist, sowie die Verwendung einer solchen rekombinanten 
Cholesterinoxidase in einem enzymatischen Test zum Nachweis von Cholesterin. Dabei wird vorzugsweise das in der 
35 Cholesterinoxidasereaktion gebildete H 2 0 2 in einer nachgeschalteten Indikatorreaktion als Mali fur das in der Probe 
vorhandene Cholesterin bestimmt. 

[0020] Die in den Beispielen genannten Plasmide pUC-Chol-B2-BB (DSM 8274), pmgl-Sphl (DSM 8272) und pfl- 
20AT1-SD (DSM 8273) wurden am 05.05.1993 bei der Deutschen Sammlung fur Zellkulturen und Mikroorganismen 
GmbH, Mascheroder Weg 1b, D - 3300 Braunschweig hinteriegt. 
40 [0021] Die Anmeldung wird durch die folgenden Beispieie in Verbindungen mit den Sequenzprotokollen und Figuren 
naher eriautert. 



SEQ ID NO 1 zeigt die Nukleinsauresequenz der erfindungsgemafien Cholesterinoxidase. 

45 SEQ ID NO 2 zeigt die Aminosauresequenz der erfindungsgemafien Cholesterinoxidase. 

SEQ ID NO 3 - 5 zeigen Nukleotidsequenzen aus erfindungsgemafien, fur ein Peptid mit Cholesterinoxidase-Ak- 
tivitat kodierenden DNA's. 



50 SEQ ID NO 6 - 17 zeigen die N-terminalen Sequenzen der erfindungsgemafien rekombinanten Cholesterinoxida- 
segene (SEQ ID NO 6, 8, 10, 12, 14 und 16) bzw. der dazugehorigen N-terminalen Aminosau- 
resequenzen (SEQ ID NO 7, 9, 11, 13, 15 und 17). 

SEQ ID NO 18 - 29 zeigen die Nukieinsauresequenzen und dazugehorigen Aminosauresequenzen von erfindungs- 
55 gemafien rekombinanten Cholesterinoxidasen. 



[0022] Dabei bedeuten: 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



Signalsequenz 


vollstandige Sequenz 


Konstrukt 


SEQ ID NO 6-7 
SEQ ID NO 8-9 
SEQ ID NO 10-11 
SEQ ID NO 12-13 
SEQ ID NO 14-15 
SEQ ID NO 16-17 


SEQ ID NO 18-19 
SEQ ID NO 20-21 
SEQ ID NO 22-23 
SEQ ID NO 24-25 
SEQ ID NO 26-27 
SEQ ID NO 28-29 


plac-Chol-cyt 

ppfl-Chol-cyt 

ppfi-MSN3H-Chol-cyt 

ppfl-MSN4H-Chol-cyt 

ppfl-MSN4R2K-Chol-cyt 

ppf!-MVM3H-Chol-cyt 



SEQ ID NO 30 - 33 



SEQ ID NO 34 



zeigen vier Oligonukleotide fur die Amplifikation eines Fragments des erfindungsgemafien Cho- 
lesterinoxidase-Gens. 

zelgt die Sequenz eines Adapteroligonukleotids fiir die in vitro-Mutagenese des Cholesterinoxi- 
dase-Gens gemafi Beispiel 5. 



Fig. 1 



zeigt das Plasmid p(JC-Chol-B2-BB. 
Fig. 2 zeigt das Plasmid plac-Chol-cyt. 
Fig. 3 zeigt das Plasmid ppfl-Chol-cyt. 
Fig. 4 zeigt das Plasmid ppfl-MSN3H-Chol-cyt. 
Beispiel 1 

Klonierung des Gens fur Cholesterinoxidase aus Brevibacterium sterolicum 

[0023] Brevibacterium sterolicum (BMTU 2407) wird in 500 ml "nutrient broth" (Difco) 20 h bei 30°C angeziichtet. Die 
Zellen werden durch Zentrifugation geerntet. Die so gewonnene Zelimasse wird in 20 mmol/l Tris/HCI pH 8,0 zu 0,4 g 
Zell-Nafigewicht/ml resuspendiert. 2,5 ml dieser Suspension werden mit 5 ml 24 % (w/v) Polyethylenglycol 6000, 2,5 
ml 20 mmol/l Tris/HCI pH 8,0 und 10 mg Lysozym versetzt und 14 h bei 4°C inkubiert. Dann erfolgt die Lyse der Zellen 
durch Zugabe von 1 ml 20 % (w/v) SDS und 2 mg Protease K und Inkubation fur 1 h bei 37°C. Diese Losung wird mit 
dem gleichen Voiumen 20 mmol/l Tris/HCI pH 8,0 versetzt und dann pro mi 1 g CsCI sowie 0,8 mg Ethidiumbromid 
zugegeben. Diese Losung wird durch Ultrazentrifugation 24 h bei 40.000 Upm in einem TV850 Vertikal-Rotor (DuPont) 
aufgetrennt. Die DNA-Bande wird dann mit einer Injektionsspritze-abgezogen. Die Entfernung des Ethidiumbromids und 
Ethanol-Fallung der DNA erfolgt wie bei Sambrook et al., Molecular Cloning, A Laboratory Manual (1989) beschrieben. 
[0024] 7 fjjQ der so gewonnenen DNA werden partiell mit der Restriktionsendonuklease Nlalll (New England Biolab) 
geschnitten, auf einem 0,8 % Agarosegel elektrophoretisch aufgetrennt und ein Grdftenbereich von ca. 2 - 12 kb aus- 
geschnitten. Die DNA-Fragmente werden aus dem Gel isoliert, mit Sphl geschnitten und anschliefiend in einen mit 
alkalischer Phosphatase aus Kalberdarm behandelten Plasmidvektor pUC1 9 ligiert. Dieser Ligationsansatz wird in kom- 
petente E. coli K12 XL1-blue (Stratagene, Katalog-Nr. 200268) transformiert. Die transformierten Zellen werden auf 
Agarplatten mit LB-Medium, das 100 /*g/ml Ampicillin enthalt, ausplattiert und uber Nacht bei 37°C inkubiert. Die hoch- 
gewachsenen Kolonien werden auf Nitrocellulosefilter (Schleicher und Schull) ubertragen, durch Behandlung mit Toluol/ 
Chloroform-Dampf lysiert und die Filter mit der Kolonieseite auf Indikatorplatten (s.u.) ubertragen. Auf diesen Indikator- 
platten erfolgt der Nachweis auf eine Cholesterinoxidase-Aktivitat durch 15- bis 30-minutige Inkubation bei Raumtem- 
peratur. 

[0025] Klone, die eine Farbreaktion zeigen, werden ausgewahlt und isoliert. Zur Kontrolle werden diese E. coli-Klone 
auf einer Agarplatte mit LB-Medium, das 100 >og/ml Ampicillin enthalt, ausgestrichen, uber Nacht bei 37°C inkubiert, die 
angewachsenen Kolonien zur Verifizierung nochmals auf zwei verschiedene Nitrozellulosefiltertransferiertund wie oben 
beschrieben mit Toluol/Chloroformdampf aufgeschlossen. Ein Filter wird wieder auf eine der oben beschriebenen Indi- 
katorplatten aufgelegt, der andere Falter auf eine Indikatorplatte ohne Cholesterin. Eine positive Farbreaktion zeigt sich 
nur auf den kompletten Indikatorplatten mit dem Substrat Cholesterin. Damit wird nachgewiesen, dafi die durch den 
entsprechenden E. coli-Klon hervorgerufene Farbreaktion tatsachlich durch aktive Cholesterinoxidase verursacht wird. 
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Herstellung der indikatorplatten: 

[0026] Fur den Plattentest zur Bestimmung von Cholesterinoxidase-Aktivitat werden 100 ml 2%ige low-mel- 
ting-point-Agarose (Sea Plaque BlOzym 501 13) aufgeschmolzen und bei einer Temperatur von 42°C eine vorgewarmte 
5 Losung von: 

48 mg 4-Aminoantipyrin (Boehringer Mannheim GmbH, Katalog-Nr. 073474) 

- 306 mg EST (N-Ethyl-N-sulfoethyl-3-methylanilinkaliumsalz (Boehringer Mannheim GmbH, Kata!og-Nr. 586854)) 

- 2,5 mg Meerrettichperoxidase Reinheitsgrad II (ca. 260 U/mg (Boehringer Mannheim GmbH, Katalog-Nr. 005096)) 
10 60 /J Natriumazidldsung (20%ig) 

10 ml 1 mol/l Kaliumphosphat pH 7,2 

150 mg Cholsaurenatriumsalz (Merck, Katalog-Nr. 12448) 

10 ml Cholesterinsubstratlosung (s. u.) 

- H 2 Oad100ml 

15 

zu der aufgeschmolzenen Agarose gegeben, vorsichtig gemischt, jeweils 10 ml in Petrischalen gegossen und zur Auf- 
bewahrung dunkel gehalten. 

Cholesterinsubstratlosung : 

20 

[0027] 500 mg Cholesterin (Boehringer Mannheim GmbH, Katalog-Nr. 121312) werden in 12,5 ml 1-Propanol (Merck, 
Katalog-Nr. 997) gelost, nach Zugabe von 1 0 g Thesit (Boehringer Mannheim GmbH, Katalog-Nr. 006190) gut gemischt 
und H 2 0 ad 100 ml zugegeben. Die Substratlosung kann bei Raumtemperatur mehrere Monate aufbewahrt werden. 

25 Beispiel 2 

Charakterisierung des Cholesterinoxidase-Gens 

[0028] Das Plasmid eines gemafi Beispiel 1 erhaltenen Klons (pUC-Cho!-B2) wird nach Standardmethoden isoliert 
30 und einer Restriktionskartierung mit den Restriktionsendonukleasen BamHI, EcoRI, Kpnl, Xhol, Pstl unterzogen. Es 
zeigt sich, dad ein DNA-Fragment aus dem Genom von Brevibacterium in der Grofie von ca. 5,5 kb in dem Plasmid 
pUC-Chol-B2 insertiert ist. Durch Subklonierung verschiedener Teilfragmente dieses 5,5 kb-Stuckes und anschliefiender 
Bestimmung der Cholesterin-oxidase-Aktivitat der erhaltenen E. coli-Klone kann das Cholesterinoxidase-Gen auf ein 
BamHI-Fragment von 2,3 kb-Grolie eingeengt werden. Das Plasmid mit diesem Fragment wird pUC-Chol-B2-BB genannt 
35 (Fig. 1). Die DNA-Sequenz dieses Fragmentes wird bestimmt und auf einem Leseraster, das fur Cholesterinoxidase 
kodiert, hin untersucht. Die Sequenz dieses Leserahmens fur die reife Cholesterinoxidase ist in SEQ ID NO 1 wieder- 
gegeben. 

Beispiel 3 

40 

Konstruktion eines Plasmids zur Expression des Cholesterinoxidase-Gens mit heterologer Signalsequenz 

[0029] Ein Vergleich der N-terminalen Arninosauresequenz von Cholesterinoxidase, die aus Brevibacterium isoliert 
wurde, mit dem gesamten fur Cholesterinoxidase kodierenden Leseraster von pUC-Chol-B2-BB zeigt, dad im reifen 

45 Protein die ersten 52 kodierten Aminosauren der Gensequenz fehlen. Diese 52 Aminosauren zeigen die Struktur einer 
typischen Exportsignalsequenz gram-positiver Prokaryonten (von Heijne, Biochim. Biophys. Acta 947 (1 988), 307 - 333). 
Fur die Konstruktion von rekombinanten Cholesterinoxidase-Genen, bei denen diese Signalsequenz gegen andere 
Sequenzen ersetzt ist, wird zunachst ein 387 bp grofles DNA-Fragment aus dem Plasmid pUC-Chol-B2-BB unter Ver- 
wendung der in SEQ ID NO 30 und 31 gezeigten Oligonukleotide mittels PCR ampliflziert. Dieses Fragment enthalt den 

50 fur den N-terminalen Teil der reifen Oxidase kodierenden Bereich mit einer neuen Sphl-Schnittstelle direkt vor dem 
N-Terminus der Arninosauresequenz des reifen Enzyms. Dieses PCR-Fragment wird mit Sphl und Pstl gespalten und 
zusammen mit einem Pstl EcoRI-Fragment aus pUC-Chol-B2-BB, das den restlichen Anteil des Cholesterinoxida- 
se-Gens enthalt, in den mit Sphl und EcoRI gespaltenen Expressionsvektor pmglSphl iigiert und so der Vektor pm- 
gl-Chol-SB erhalten. In diesem Vektor enthalt das Cholesterinoxidase-Gen eine in E. coli funktionelle Signalsequenz 

55 aus Salmonella typhimurium (beschrieben in WO 88/093773). 
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Beispiel 4 

Konstruktion eines Plasmids zur Expression des Cholesterin-oxidase-Gens ohne Signalpeptid-kodierende 
Sequenz unter Kontrolle des lacllVS-Promotors 

5 

[0030] Aus dem Plasmid pmgl~Chol-SB wird durch Behandlung mit den Restriktionsendonukleasen Sphl und BamBI 
ein DNA-Fragment von ca. 1 ,85 kb Grofte herausgeschnitten, das den gesamten Anteil der kodierenden Sequenz der 
reifen Cholesterinoxidase, aber nicht die fur das Signal-Peptid kodierende Sequenz enthalt. Dieses Fragment wird in 
den vorher mit Sphl und BamBI geschnittenen Plasmidvektor pUC19 eingesetzt. In dem so erhaltenen Plasmid 
10 plac-Chol-cyt liegt das Cholesterin-oxidase-Gen im korrekten Leseraster an die ersten zehn Codons des lacZ'-Gens 
aus pUC19 anfusioniert vor und liegt unter der Kontrolle des lacUV5-Promotors (Fig. 2). 

Beispiel 5 

15 Konstruktion eines Plasmids zur Expression des Cholesterin-oxidase-Gens ohne Signalpeptid-kodierende 
Sequenz unter Kontrolle des sauerstoffregulierten pfl-Promotors 

[0031] Durch PCR-Technik wird aus dem Plasmid plac_Chol_cyt unter Verwendung der in SEQ ID NO 32 und 33 
dargestellten Oligonukleotide ein DNA-Fragment von 432 bp Grofce erzeugt, das vor dem ATG-Startcodon eine 

20 Clal-Schnittstelle enthalt. Dieses PCR-Fragment wird mit Clal und Pstl geschnitten. Durch Behandlung mit den Restrik- 
tionsendonukleasen Pstl und BamHI wird aus dem Plasmid plac-Chol-cyt weiterhin ein Fragment mit dem restlichen 
C-terminalen Anteil des Cholesterinoxidase-Gens herausgeschnitten. Beide Fragmente werden simultan in den mit 
BamHI und Clal gespaltenen Expressionsvektor pfl 20AT1-SD einligiert. Das korrekte Ligationsprodukt enthalt nun den 
Leserahmen der reifen Cholesterinoxidase anfusioniert an die ersten zehn Codons des lacZ'-Gens aus pUC19 unter 

25 der Kontrolle des sauerstoffregulierten pfl-Promotors (Fig. 3). Dieses Plasmid tragt die Bezeichnung ppfl-Chol-cyt. 

Beispiel 6 

Konstruktion eines Plasmids zur Expression des Cholesterin-oxidase-Gens mit alternativer N-terminaler Fu- 
30 sionssequenz 

[0032] Zur Entfernung der im 3* untranslatierten Bereich des Cholesterinoxidase-Gens gelegenen Sphl-Schnittstelle 
des Plasmids ppfl-Chol-cyt wird die Plasmid-DNA mit Smal und EcoRV geschnitten und wieder religiert. 100 ng des so 
entstandenen Plasmids ppfl-ChoI-cyt-Aterm werden dann mit den Restriktionsenzymen Clal und Sphl gespalten. Das 

35 entstandende 4,76 kb grofie DNA-Fragment wird in low-melting -point Agarose elektrophoretisch aufgetrennt, ausge- 
schnitten und eluiert (Glassmilk®-Kit, Bio 101). 100ng des so gereinigten DNA-Fragments werden mit 50 pmol eines 
Adapter-Oligonukteotids mit der in SEQ ID NO 34 dargestellten Sequenz (wobei "N" eine aquimolare Mischung aller4 
Basen bedeutet) versetzt und 2 Stunden bei 37°C mit T4-DNA-Ligase behandelt. Anschlieftend wird der Ansatz mit 
einer Mischung aus 4 dNTP's (Endkonz. 0,125 mmol/l) versetzt und 40 Minuten bei 37°C mit Klenow-DNA-Polymerase 

40 behandelt. Die so erhaltene Plasmid-DNA wird in E. coli XL1-blue (Stratagene) transformiert. Mit Hilfe des in Beispiel 1 
beschriebenen Kolonie-Aktivitatstest werden einzelne Kolonien von erhaltenen Klonen bezuglich ihrer Cholesterinoxi- 
dase-Aktivitat verglichen. Klone mit hoher Cholesterinoxidase-Aktivitat werden isoliert und die Plasmid-DNA durch Re- 
striktionsanalvse und DNA-Sequenzierung charakterisiert. Fur das Plasmid eines Klons mit besonders hoher Choleste- 
rinoxidase-Aktivitat wird die Sequenz SEQ ID NO 23 ermittelt. Das betreffende Plasmid wird ppfl-MSM3H-Chol-cyt-Aterm 

45 genannt. Es ist zu_erwarten, dali in der dargestellten Art und Weise nach Isolierung und Charakterisierung genugend 
vieler verschiedener Klone auch noch weitere fur eine besonders hohe Expression geeignete Klone gefunden werden 
kbnnen. Zur Wiedervervollstandigung des 3-untranslatierten Anteils wird das Plasmid ppfl-MSN3H-Chol-cyt-Aterm mit 
Clal und Xhol geschnitten. Ein DNA-Fragment von ca. 1 ,1 kb mit der Translationsinitiationsregion und dem N-terminalen 
Anteil des Cholesterinoxidase-Gens wird isoliert und in das ebenfalls mit Clal und Xhol geschnittene Plasmid ppfl-Chol-cyt 

so einligiert (Fig. 4). Das erhaltene Plasmid tragt die Bezeichnung ppfl-MSN3H-Chol-cyt. 

Beispiel 7 

Vergleich der Bildung von Cholesterinoxidase durch die verschiedenen Expressionsplasmide in E. coli 

55 

[0033] Die Plasmide pUC-Chol-B2, pUC-Chol-B2-BB, pmgl-Chol-SB, plac-Chol-cyt, ppfl-Chol-cyt, 
ppfl-MSN3H-Chol-cyt werden jeweils in E. coli K1 2 XL1-blue transformiert. Zum Vergleich der gebildeten Enzymmenge 
werden die Klone jeweils 1 5 Stunden bei 30°C in LB-Medium, das 200 ^g/ml Ampicillin und folgende weiteren Zusatze 



6 



EP 0 698 102 B1 

enthalt, angezogen: 

Klone mit den Plasmiden pUC-Chol-B2 t pUC-Chol-B2-BB, plac-Chol-cyt, bei denen das Chofesterinoxidase-Gen jeweils 
unter der Kontrolle des I acUV5-Pro motors steht, bekommen zusatzlich 1 mmol/l IPTG, der Klon mit dem Piasmid pm- 
gl-Chol-SB mit dem Glucose-reprimierten mgl-Promotor erhait keinen weiteren Zusatz, Klone mit den Plasmiden 

5 ppfl-Chol-cyt, ppfi-MSN3H-Chol-cyt mit dem sauerstoffregulierten pfl-Promotor erhalten 0,4% Glucose und werden in 
Stickstoff begasten verschlossenen Serumflaschen angezogen, wobei das Medium mit KOH auf pH 7,0 eingestellt 
wurde. Nach erfolgter Anzucht wird die erreichte Zelldichte durch photometrische Messung der Trubung bei 420 nm 
bestimmt. Die Zellen von 1 ml Kulturbruhe werden dann durch Zentrifugation in einer Mikrozentrifuge bei 10.000 g 
sedimentiert und wieder in 0,5 ml H 2 0 bidest resuspendiert. Der Zellaufschlufi erfolgt durch 2 x 30 Sekunden Ultra- 

10 schallbehandlung (Branson Sonfier, Modell 450, Standard-Microtip, Konisch). Die so erhaltenen Zellextrakte werden 
nach entsprechender Verdunnung in den folgenden Enzymtest eingesetzt: Hierzu werden in Quartz-Kuvetten pipetttert: 
3 ml Kaliumphosphatpuffer (0,5 mol/l, pH 7,5), der 0,4 % Thesit® (Boehringer Mannheim GmbH, Katalog-Nr. 006190) 
enthalt, 

0,1 ml Cholesterinlosung (0,4 % Cholesterin, 10 % 1-Propanol, 10 % Thesit®), 

15 0,02 ml H 2 0 2 (0,49 mol/l in bidest. Wasser), 

es wird gemischt, nach Zugabe von 0,02 ml Katalase (aus Rinderleber, 20 mg Protein/ml, spezifische Aktivitat ca. 65.000 
U/mg, Boehringer Mannheim GmbH, Katalog-Nr. 01 56744 unmittelbar vor Messung mit eiskaltem Kaliumphosphatpuffer, 
der 0,4 % Thesit enthalt, auf 0,075 - 0,15 U/ml verdunnt) erneut gemischt, die Losung auf eine Temperatur von 25°C 
gebracht und anschlieliend die Reaktion durch Zugabe von 0,05 ml Probelosung gestartet. Nach vorsichtigem Mischen 

20 wird die Absorptionsanderung bei 240 nm verfolgt und die Aktivitat der Cholesterinoxidase aus dem linearen Bereich 
der Absorptionskurve ermittelt: 



25 3,19 

Aktivitat = A A min. (U/ml Probelosung) 

€ 240 x 0,05 x 1 

30 

wobei g 240 = 15,5 mmol" 1 x 1 x cnrr 1 ist. 

[0034] Die erhaltenen Werte fur Zelldichte und Enzymaktivitat sind in Tabelle 1 dargestellt. 



Tabeile 1 



Klon/Plasmid 


Zelldichte (E 420) 


Units je Zelldichte 


Units pro ml 


pUC-Chol-B2 


7,0 


0,007 


0,049 


pUC-Chol-B2-BB 


8,4 


0,068 


0,571 


pmgl-Chol-SB 


1,3 


0,014 


0,018 


plac-Chol-cyt 


8,6 


0,725 


6,235 


ppfl-Chol-cyt 


1,25 


1,675 


2,094 


ppfl-MSN3H-Chol-cyt 


3,7 


1,463 


5,413 



[0035] Die erhaltenen Ergebnisse zeigen, dad mit solchen Konstrukten, die eine zytoplasmatische Expression der 
Cholesterinoxidase bewirken, eine deutlich hohere Aktivitat der rekombinant hergestellten Cholesterinoxidase erhalten 
werden kann als mit solchen Konstrukten, die zu einer Sekretion der rekombinant hergestellten Cholesterinoxidase 
fiihren. 

SEQUENZPROTOKOLL 
[0036] 

(1) ALGEMEINE INFORMATION: 
(i) ANMELDER: 

(A) NAME: Boehringer Mannheim GmbH 
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(B) STRASSE: Sandhofer Str. 116 

(C) ORT: Mannheim 

(E) LAND: Deutschiand 

(F) POSTLEITZAHL: D - 6800 

5 

(ii) ANMELDETITEL: Cholesterinoxidase aus Brevibacterium sterolicum 

(iii) ANZAHL DER SEQUENZEN: 34 
10 (iv) COMPUTER-LESBARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

15 (D) SOFTWARE: Patentln Release #1 .0, Version #1 .25 (EPA) 

(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

20 

(A) LANGE: 1683 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

25 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(ix) MERKMALE: 

30 (A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1..1683 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

35 



40 



45 



50 
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10 



15 



20 



40 



45 



50 



TCG ACC GGG CCG GTC GCG CCG CTT CCG ACG CCG CCG AAC TTC CCG AAC 48 
. Ser Thr Gly Pro Val Ala Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn 
1 5 10 15 

GAC ATC GCG CTG TTC CAG CAG GCG TAG CAG AAC TGG TCC AAG GAG ATC 96 
Asp lie Ala Leu Phe Gin Gin Ala Tyr Gin Asn Trp "Ser Lys Glu lie 
20 25 30 

ATG CTG GAC GCC ACT TGG GTC TGC TCG CCC AAG ACG CCG CAG GAT GTC 144 
Met Leu Asp Ala Thr Trp Val Cys Ser Pro Lys Thr Pro Gin Asp Val 
35 40 45 

GTT CGC CTT GCC AAC TGG GCG CAC GAG CAC GAC TAC AAG ATC CGC CCG 192 
Val Arg Leu Ala Asn Trp Ala His Glu His Asp Tyr Lys lie Arg Pro 
50 55 60 

CGC GGC GCG ATG CAC 6GC TGG ACC CCG CTC ACC GTG GAG AAG GGG GCC 240 
Arg Gly Ala Met His Gly Trp Thr Pro Leu Thr Val Glu Lys Gly Ala 
65 70 75 80 

AAC GTC GAG AAG GTG ATC CTC GCC GAC ACG ATG ACG CAT CTG AAC GGC 288 
Asn Val Glu Lys Val lie Leu Ala Asp Thr Met Thr His Leu Asn Gly 
85 90 95 



ATC ACG GTG AAC ACG GGC GGC CCC GTG GCT ACC GTC ACC GCC GGT GCC 336 
lie Thr Val Asn Thr Gly Gly Pro Val Ala Thr Val Thr Ala Gly Ala 
25 100 105 110 

GGC GCC AGC ATC GAG GCG ATC GTC ACC GAA CTG CAG AAG CAC GAC CTC 384 
Gly Ala Ser lie Glu Ala He Val Thr Glu Leu Gin Lys His Asp Leu 
115 120 125 

30 GGC TGG GCC AAC CTG CCC GCT CCG GGT GTG CTG TCG ATC GGT GGC GCC 432 

Gly Trp Ala Asn Leu Pro Ala Pro Gly Val Leu Ser He Gly Gly Ala 
130 135 140 

CTT GCG GTC AAC GCG CAC GGT GCG GCG CTG CCG GCC GTC GGC CAG ACC 480 
Leu Ala Val Asn Ala His Gly Ala Ala Leu Pro Ala Val Gly Gin Thr 
35 145 150 155 , 160 

ACG CTG CCC GGT CAC ACC TAC GGT TCG CTG AGC AAC CTG GTC ACC GAG 528 
Thr Leu Pro Gly His Thr Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu 
165 170 175 



CTG ACC GCG GTC GTC TGG AAC GGC ACC ACC TAC GCA CTC GAG ACG TAC 576 
Leu Thr Ala Val Val Trp Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr 
180 185 190 

CAG CGC AAC GAT CCT CGG ATC ACC CCA CTG CTC ACC AAC CTC GGG CGC 624 
Gin Arg Asn Asp Pro Arg He Thr Pro Leu Leu Thr Asn Leu Gly Arg 
195 200 205 

TGC TTC CTG ACC TCG GTG ACG ATG CAG GCC GGC CCC AAC TTC CGT CAG 672 
Cys Phe Leu Thr Ser Val Thr Met Gin Ala Gly Pro Asn Phe Arg Gin 
210 215 220 

CGG TGC CAG AGC TAC ACC GAC ATC CCG TGG CGG GAA CTG TTC GCG CCG 720 
Arg Cys Gin Ser Tyr Thr Asp He Pro Trp Arg Glu Leu Phe Ala Pro 
225 230 235 240 



55 
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AAG GGC GCC GAC GGC CGC ACG TTC GAG AAG TTC GTC GCG GAA TCG GGC 76B 
Lys Gly Ala Asp Gly Arg Thr Phe Glu Lys Phe Val Ala Glu Ser Gly 
245 250 255 

GGC GCC GAG GCG ATC TGG TAC CCG TTC ACC GAG AAG CCG TGG ATG AAG 816 
Gly Ala Glu Ala lie Trp Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys 
- -260 . 265 270 

GTG TGG ACG GTC TCG CCG ACC AAG CCG GAC TCG TCG AAC GAG GTC GGA 864 
Val Trp Thr Val Ser Pro Thr Lys Pro Asp Ser Ser Asn Glu Val Gly 
275 280 285 

AGC CTC GGC TCG GCG GGC TCC CTC GTC GGC AAG CCT CCG CAG GCG CGT 912 
Ser Leu Gly Ser Ala Gly Ser Leu Val Gly Lys Pro Pro Gin Ala Arg 
290 295 300 

GAG GTC TCC GGC CCG TAC AAC TAC ATC TTC TCC GAC AAC CTG CCG GAG 960 
Glu Val Ser Gly Pro Tyr Asn Tyr He Phe Ser Asp Asn Leu Pro Glu 
305 310 315 320 

CCC ATC ACC GAC ATG ATC GGC GCC ATC AAC GCC GGA AAC CCC GGA ATC 1008 
20 Pro He Thr Asp Met He Gly Ala lie Asn Ala Gly Asn Pro Gly He 

325 330 335 

GGA CCG CTG TTC GGC CCG GCG ATG TAC GAG ATC ACC AAG CTC GGG CTG 1056 
Ala Pro Leu Phe Gly Pro Ala Met Tyr Glu He Thr Lys Leu Gly Leu 
340 345 350 

25 

GCC GCG ACG AAT GCC AAC GAC ATC TGG GGC TGG TCG AAG GAC GTC CAG 1104 
Ala Ala Thr Asn Ala Asn Asp He Trp Gly Trp Ser Lys Asp Val Gin 
355 360 365 

TTC TAC ATC AAG GCC ACG ACG TTG CGA CTC ACC GAG GGC GGC GGC GCC 1152 
Phe Tyr He Lys Ala Thr Thr Leu Arg Leu Thr Glu Gly Gly Gly Ala 
370 375 380 

GTC GTC ACG AGC CGC GCC AAC ATC GCG ACC GTG ATC AAC GAC TTC ACC 1200 
Val Val Thr Ser Arg Ala Asn He Ala Thr Val He Asn Asp Phe Thr 
385 390 395 400 

GAG TGG TTC CAC GAG CGC ATC GAG TTC TAC CGC GCG AAG GGC GAG TTC 1248 
Glu Trp Phe His Glu Arg He Glu Phe Tyr Arg Ala Lys Gly Glu Phe 
405 410 415 

40 CCG CTC AAC GGT CCG GTC GAG ATC CGC TGC TGC GGG CTC GAT CAG GCA 1296 

Pro Leu Asn Gly Pro Val Glu He Arg Cys Cys Gly Leu Asp Gin Ala 
420 425 430 

GCC GAC GTC AAG GTG CCG TCG GTG GGC CCG CCG ACC ATC TCG GCG ACC 1344 
Ala Asp Val Lys Val Pro Ser Val Gly Pro Pro Thr He Ser Ala Thr 
45 435 440 445 

CGT CCG CGT CCG GAT CAT CCG GAC TGG GAC GTC GCG ATC TGG CTG AAC 1392 
Arg Pro Arg Pro Asp His Pro Asp Trp Asp Val Ala He Trp Leu Asn 
450 455 460 

GTT CTC GGT- GTT CCG GGC ACC CCC GGC ATG TTC GAG TTC TAC CGC GAG 1440 
Val Leu Gly Val Pro Gly Thr Pro Gly Met Phe Glu Phe Tyr Arg Glu 
465 470 475 480 

ATG GAG CAG TGG ATG CGG AGC CAC TAC AAC AAC GAC GAC GCC ACC TTC 1488 
55 Met Glu Gin Trp Met Arg Ser His Tyr Asn Asn Asp Asp Ala Thr Phe 

485 490 495 
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CGG CCC GAG TGG TCG AAG GGG TGG GCG TTC GGT CCC GAC CCG TAC ACC 1536 

Arg Pro Glu Trp Ser Lys Gly Trp Ala Phe Gly Pro Asp Pro Tyr Thr 

500 505 510 

5 

GAC AAC GAC ATC GTC ACG AAC AAG ATG CGC GCC ACC TAC ATC GAA GGT 1584 

Asp Asn Asp lie Val Thr Asn Lys Met Arg Ala Thr Tyr lie Glu Gly 
515 520 525 

GTC CCG ACG ACC GAG AAC TGG GAC ACC GCG CGC GCT CGG TAC AAC CAG 1632 
10 Val Pro Thr Thr Glu Asn Trp Asp Thr Ala Arg Ala Arg Tyr Asn Gin 

530 535 540 

ATC GAC CCG CAT CGC GTG TTC ACC AAC GGA TTC ATG GAC AAG CTG CTT 1680 
lie Asp Pro His Arg Val Phe Thr Asn Gly Phe Met Asp Lys Leu Leu 

545 - 550 - - - 555 _ . 560 



15 



CCG 1683 
Pro 



20 (2) INFORMATION ZU SEQ ID NO: 2: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 561 AminosSuren 
25 (B) ART: Aminosaure 

(D) TOPOLOGIE: linear 

(ii) ART DES MQLEKOLS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

30 



35 



40 



45 



50 



55 
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Ser Thr Gly Pro Val Ala Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn 
15 10 15 

Asp He Ala Leu Phe Gin Gin Ala Tyr Gin Asn Trp Ser Lys Glu He 
20 25 30 

Met Leu Asp Ala Thr Trp Val Cys Ser Pro Lys Thr Pro Gin Asp Val 
35 40 45 

Val Arg Leu Ala Asn Trp Ala His Glu His Asp Tyr Lys He Arg Pro 
50 55 60 

Arg Gly Ala Met His Gly Trp Thr Pro Leu Thr Val Glu Lys Gly Ala 
65 70 75 80 

Asn Val Glu Lys Val He Leu Ala Asp Thr Met Thr His Leu Asn Gly 
85 90 95 

He Thr Val Asn Thr Gly Gly Pro Val Ala Thr Val Thr Ala Gly Ala 
100 105 110 

Gly Ala Ser He Glu Ala He Val Thr Glu Leu Gin Lys His Asp Leu 
115 120 125 

Gly Trp Ala Asn Leu Pro Ala Pro Gly Val Leu Ser He Gly Gly Ala 
130 135 140 

Leu Ala Val Asn Ala His Gly Ala Ala Leu Pro Ala Val Gly Gin Thr 
145 150 155 160 

Thr Leu Pro Gly His Thr Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu 
165 170 175 

Leu Thr Ala Val Val Trp Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr 
180 185 190 

Gin Arg Asn Asp Pro Arg He Thr Pro Leu Leu Thr Asn Leu Gly Arg 

35 195 200 205 

Cys Phe Leu Thr Ser Val Thr Met Gin Ala Gly Pro Asn Phe Arg Gin 
210 215 220 



10 



15 



20 



25 



30 



40 



Arg Cys Gin Ser Tyr Thr Asp He Pro Trp Arg Glu Leu Phe Ala Pro 

225 230 235 240 

Lys Gly Ala Asp Gly Arg Thr Phe Glu Lys Phe Val Ala Glu Ser Gly 
245 250 255 

45 Gly Ala Glu Ala He Trp Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys 

260 265 270 



50 



55 
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Val Trp Thr Val Ser Pro Thr Lys Pro Asp Ser Ser Asn Glu Val Gly 
275 280 285 

Ser Leu Gly Ser Ala Gly Ser Leu Val Gly Lys Pro Pro Gin Ala Arg 
290 295 300 

Glu Val Ser Gly Pro Tyr Asn Tyr He Phe Ser Asp Asn Leu Pro Glu 
305 310 315 320 

Pro He Thr Asp Met He Gly Ala He Asn Ala Gly Asa Pro Gly He 
325 330 335 

Ala Pro Leu Phe Gly Pro Ala Met Tyr Glu He Thr Lys Leu Gly Leu 
340 345 350 

Ala Ala Thr Asn Ala Asn Asp He Trp Gly Trp Ser Lys Asp Val Gin 
355 360 365 

Phe Tyr He Lys Ala Thr Thr Leu Axg Leu Thr Glu Gly Gly Gly Ala 
370 375 380 

Val Val Thr Ser Arg Ala Asn He Ala Thr Val He Asn Asp Phe Thr 
385 390 395 400 

Glu Trp Phe His Glu Arg He Glu Phe Tyr Arg Ala Lys Gly Glu Phe 
405 410 415 

Pro Leu Asn Gly Pro Val Glu He Arg Cys Cys Gly Leu Asp Gin Ala 
420 425 430 

Ala Asp Val Lys Val Pro Ser Val Gly Pro Pro Thr He Ser Ala Thr 
435 440 445 

Arg Pro Arg Pro Asp His Pro Asp Trp Asp Val Ala He Trp Leu Asn 
450 455 460 

Val Leu Gly Val Pro Gly Thr Pro Gly Met Phe Glu Phe Tyr Arg Glu 
465 470 475 480 

Met Glu Gin Trp Met Arg Ser His Tyr Asn Asn Asp Asp Ala Thr Phe 
485 490 495 

Arg Pro Glu Trp Ser Lys Gly Trp Ala Phe Gly Pro Asp Pro Tyr Thr 
500 505 510 • 

Asp Asn Asp He Val Thr Asn Lys Met Arg Ala Thr Tyr He Glu Gly 
515 520 525 

Val Pro Thr Thr Glu Asn Trp Asp Thr Ala Arg Ala Arg Tyr Asn Gin 
530 535 540 

He Asp Pro His Arg Val Phe Thr Asn Gly Phe Met Asp Lys Leu Leu 
545 550 555 560 



Pro 



(2) INFORMATION ZU SEQ ID NO: 3: 
(i) SEQUENZ CHARAKTERISTIKA: 
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(A) LANGE: 48 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

5 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 
TTCCCGCTCA ACGGTCCGGT CGAGATCCGC TGCTGCGGGC TCGATCAG 

10 

(2) INFORMATION ZU SEQ ID NO: 4: 
(i) SEQUENZ CHARAKTERISTIKA: 

15 (A) LANGE: 48 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

20 (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 



GCGATCTGGC TGAACGTTCT CGGTGTTCCG GGCACCCCCG GCATGTTC 48 

25 

(2) INFORMATION ZU SEQ ID NO: 5: 
(i) SEQUENZ CHARAKTERISTIKA: 

30 (A) LANGE: 36 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

35 (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 



GACGCCACCT TCCGGCCCGA GTGGTCGAAG GGGTGG 

40 

(2) INFORMATION ZU SEQ ID NO: 6: 
(i) SEQUENZ CHARAKTERISTIKA: 

<5 (A) LANGE: 46 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

50 (ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 17..46 

55 ( X i) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 
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10 



20 



25 



30 



35 



40 



50 



CACACAGGAA ACAGCT ATG ACC ATG ATT ACG CCA AGC TTG CAT GCC 46 
Met Thr Met lie Thr Pro Ser Leu His Ala 

.1 5 10 



(2) INFORMATION ZU SEQ ID NO: 7: 
(i) SEQUENZ CHARAKTERISTIKA: 



(A) LANGE: 10 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

15 (jj) ART DES KOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 



Met Thr Met lie Thr Pro Ser Leu His Ala 
15 10 

(2) INFORMATION ZU SEQ ID NO: 8: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 49 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Elnzel 

(D) TOPOLOGIE: linear 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 20..49 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

GAATTTAAGG GGAAGATCG ATG ACC ATG ATT ACG CCA AGC TTG CAT GCC 49 

Met Thr Met lie Thr Pro Ser Leu His Ala 
15 10 



(2) INFORMATION ZU SEQ ID NO: 9: 
45 (j) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 10 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKQLS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 



55 Met Thr Met lie Thr Pro Sex Leu His Ala 

15 10 
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(2) INFORMATION ZU SEQ ID NO: 10: 
(i) SEQUEN2 CHARAKTERISTIKA: 

(A) LANGE: 43 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 20..43 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 



GAATTTAAGG GGAACATCG ATG AGT AAT CAC CAT GGG CAT GCC 

Met Ser Asn His His Gly His Ala 
1 5 



(2) INFORMATION ZU SEQ ID NO: 11: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 8 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 



Met Ser Asn His His Gly His Ala 
1 5 



(2) INFORMATION ZU SEQ ID NO: 12: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 45 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 19..45 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 



AATTTGGAGG GGAACATT ATG AGT AAT CAT CAC CAT GGG CAT GCC 

Met Ser Asn His His His Gly His Ala 
1 5 
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(2) INFORMATION ZU SEQ ID NO: 13: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 9 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 



Met Ser Asn His His His Gly His Ala 
1 5 



(2) INFORMATION ZU SEQ ID NO: 14: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 58 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Elnzel 

(D) TOPOLOGIE: linear 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 20..58 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 



GAATTTAAGG GGAACATCG ATG ACT AAT ACG CGT AAA CGC AAG CGC CGT ACG 

Met Ser Asn Thr Arg Lys Arg Lys Arg Arg Thr 
1 5 10 

CAT GCC 
His Ala 



(2) INFORMATION ZU SEQ ID NO: 15: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 



Met Ser Asn Thr Arg Lys Arg Lys Arg Arg Thr His Ala 
15 10 



(2) INFORMATION ZU SEQ ID NO: 16: 
(i) SEQUENZ CHARAKTERISTIKA: 



17 
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10 



(A) LANGE: 48 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: CDS 

(B) LAGE: 25..48 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 



GAATTCACAC AGGAAACAGA ATTC ATG GTT ATG CAC CAT GGG CAT GCC 48 
is Met Val Met His His Gly His Ala 

1 5 



20 



30 



(2) INFORMATION ZU SEQ ID NO: 17: 
(i) SEQUENZ CHARAKTERISTIKA: 



(A) LANGE: 8 Aminosauren 

(B) ART: AminosSure 
25 (D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 



Met Val Met His His Gly His Ala 
1 5 



(2) INFORMATION ZU SEQ ID NO: 18: 

35 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1729 Basenpaare 

(B) ART: Nukleinsaure 

40 (C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ix) MERKMALE: 

45 (A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 17..1729 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 



55 
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10 



15 



20 



CACACAGGAA ACAGCT ATG ACC ATG ATT ACG CCA AGC TTG CAT GCC TCG 49 
Met Thr Met He Thr Pro Ser Leu His Ala Ser 
1 5 10 

ACC GGG CCG GTC GCG CCG CTT CCG ACG CCG CCG AAC TTC CCG AAC GAC 97 
Thr Gly Pro Val Ala Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn Asp 
15 20 25 

ATC GCG CTG TTC CAG CAG GCG TAC CAG AAC TGG TCC AAG GAG ATC ATG 145 
He Ala Leu Phe Gin Gin Ala Tyr Gin Asn Trp Ser Lys Glu He Met 
30 35 40 

CTG GAC GCC ACT TGG GTC TGC TCG CCC AAG ACG CCG CAG GAT GTC GTT 193 
Leu Asp Ala Thr Trp Val Cys Ser Pro Lys Thr Pro Gin Asp Val Val 
45 50 55 

CGC CTT GCC AAC TGG GCG CAC GAG CAC GAC TAC AAG ATC CGC CCG CGC 241 
Arg Leu Ala Asn Trp Ala His Glu His Asp Tyr Lys He Arg Pro Arg 
60 65 70 75 



25 



30 



35 



40 



45 



50 



55 
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GGC GCG ATG CAC GGC TGG ACC CCG CTC ACC GTG GAG AAG GGG GCC AAC 289 

Gly Ala Met His Gly Trp Thr Pro Leu Thr Val Glu Lys Gly Ala Asn 
60 85 90 

5 GTC GAG AAG GTG ATC CTC GCC GAC ACG ATG ACG CAT CTG AAC GGC ATC 337 

Val Glu Lys Val lie Leu Ala Asp Thr Met Thr His Leu Asn Gly lie 
95 100 105 

ACG GTG AAC ACG GGC GGC CCC GTG GCT ACC GTC ACC GCC GGT GCC GGC 385 

10 Thr Val Asn Thr Gly Gly Pro Val Ala Thr Val Thr Ala Gly Ala Gly 

110 115 120 

GCC AGC ATC GAG GCG ATC GTC ACC GAA CTG CAG AAG CAC GAC CTC GGC 433 

Ala Ser lie Glu Ala lie Val Thr Glu Leu Gin Lys His Asp Leu Gly 
125 130 135 

15 

TGG GCC AAC CTG CCC GCT CCG GGT GTG CTG TCG ATC GGT GGC GCC CTT 481 

Trp Ala Asn Leu Pro Ala Pro Gly Val Leu Ser He Gly Gly Ala Leu 

140 145 150 155 

GCG GTC AAC GCG CAC GGT GCG GCG CTG CCG GCC GTC GGC CAG ACC ACG 529 

20 Ala Val Asn Ala His Gly Ala Ala Leu Pro Ala Val Gly Gin Thr Thr 

160 165 170 

CTG CCC GGT CAC ACC TAC GGT TCG CTG AGC AAC CTG GTC ACC GAG CTG 577 

Leu Pro Gly His Thr Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu Leu 
175 180 185 

25 

ACC GCG GTC GTC TGG AAC GGC ACC ACC TAC GCA CTC GAG ACG TAC CAG 625 

Thr Ala Val Val Trp Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr Gin 
190 195 200 

CGC AAC GAT CCT CGG ATC ACC CCA CTG CTC ACC AAC CTC GGG CGC TGC 673 

30 Arg Asn Asp Pro Arg He Thr Pro Leu Leu Thr Asn Leu Gly Arg Cys 

205 210 215 

TTC CTG ACC TCG GTG ACG ATG CAG GCC GGC CCC AAC TTC CGT CAG CGG 721 

Phe Leu Thr Ser Val Thr Met Gin Ala Gly Pro Asn Phe Arg Gin Arg 

35 220 225 230 235 

TGC CAG AGC TAC ACC GAC ATC CCG TGG CGG GAA CTG TTC GCG CCG AAG 769 

Cys Gin Ser Tyr Thr Asp He Pro Trp Arg Glu Leu Phe Ala Pro Lys 
240 245 250 

40 GGC GCC GAC GGC CGC ACG TTC GAG AAG TTC GTC GCG GAA TCG GGC GGC 817 

Gly Ala Asp Gly Arg Thr Phe Glu Lys Phe Val Ala Glu Ser Gly Gly 
255 260 265 

GCC GAG GCG ATC TGG TAC CCG TTC ACC GAG AAG CCG TGG ATG AAG GTG 865 

Ala Glu Ala He Trp Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys Val 
45 270 275 280 

TGG ACG GTC TCG CCG ACC AAG CCG GAC TCG TCG AAC GAG GTC GGA AGC 913 

Trp Thr Val Ser Pro Thr Lys Pro Asp Ser Ser Asn Glu Val Gly Ser 
265 290 295 

50 CTC GGC TCG GCG GGC TCC CTC GTC GGC AAG CCT CCG CAG GCG CGT GAG 961 

Leu Gly Ser Ala Gly Ser Leu Val Gly Lys Pro Pro Gin Ala Arg Glu 

300 305 310 315 



GTC TCC GGC CCG TAC AAC TAC ATC TTC TCC GAC AAC CTG CCG GAG CCC 1009 
Val Ser Gly Pro Tyr Asn Tyr lie Phe Ser Asp Asn Leu Pro Glu Pro 
320 325 330 
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5 


ATC ACC GAC 
He Thr Asp 


ATG 
Wet 
335 


ATC 
He 


GGC 
Gly 


GCC 
Ala 


ATC 
He 


AAC 
Asn 
340 


GCC 
Ala 


GGA AAC 
Gly Asn 


CCC 
Pro 


GGA 
Gly 
345 


ATC 
He 


GGA 
Ala 


1057 




CCG CTG TTC 
Pro Leu Phe 
350 


GGC 
Gly 


CCG 
Pro 


GCG 
Ala 


ATG 
Met 


TAC 
Tyr 
355 


GAG 
Glu 


ATC 
He 


ACC AAG 
Thr Lys 


CTC 
Leu 
360 


GGG 
Gly 


CTG 
Leu 


GCC 
Ala 


1105 


10 


GCG ACG AAT 
Ala Thr Asn 

' 365 


GCC 
Ala 


AAC 
Asn 


GAC 
Asp 


ATC 
He 
370 


TGG 
Trp 


GGC 
Gly 


TGG 
Trp 


TCG AAG 
Ser Lys 
375 


GAC 
Asp 


GTC 
Val 


CAG 
Gin 


TTC 
Phe 


1153 


15 


TAC ATC AAG 
Tyr He Lys 
380 


GCC 
Ala 


ACG 
Thr 


ACG 
Thr 
385 


TTG 
Leu 


CGA 
Arg 


CTC 
Leu 


ACC 
Thr 


GAG GGC 
Glu Gly 

f* e\ r\ 

390 


GGC 
Gly 


GGC 
Gly 


GCC 
Ala 


GTC 
Val 
395 


1201 




GTC ACG AGC 
Val Thr Ser 


CGC 
Arg 


GCC 
Ala 
400 


AAC 
Asn 


ATC 
He 


GCG 
Ala 


ACC 
Thr 


GTG 
Val 
405 


ATC AAC 
lie Asn 


GAC 
Asp 


TTC 
Phe 


ACC 
Thr 
410 


GAG 
Glu 


1249 


20 


TGG TTC CAC 
Trp Phe His 


GAG 
Glu 
-415 


CGC 
Arg 


ATC 
He 


GAG 
Glu 


TTC 
Phe 


TAC 
Tyr 
420 


CGC 
Arg 


GCG AAG 
Ala Lys 


GGC 
Gly 


GAG 
Glu 
425 


TTC 
Phe 


CCG 
Pro 


1297 


25 


CTC AAC GGT 
Leu Asn Gly 
430 


CCG 
Pro 


GTC 
Val 


GAG 
Glu 


ATC 
He 


CGC 
Arg 
435 


TGC 
Cys 


TGC 
Cys 


GGG CTC 
Gly Leu 


GAT 
Asp 
440 


CAG 
Gin 


GGA 
Ala 


GCC 
Ala 


1345 


30 


GAC GTC AAG 
Asp Val Lys 
445 


GTG 
Val 


CCG 
Pro 


TCG 
Ser 


GTG 
Val 
450 


GGC 
Gly 


CCG 
Pro 


CCG 
Pro 


ACC ATC 
Thr He 
455 


TCG 
Ser 


GCG 
Ala 


ACC 
Thr 


CGT 
Arg 


1393 


CCG CGT CCG 
Pro Arg Pro 
460 . 


GAT 
Asp 


CAT 
His 


CCG 
Pro 
465 


GAC 
Asp 


TGG 
Trp 


GAC 
Asp 


GTC 
Val 


GCG ATC 
Ala He 
470 


TGG 
Trp 


CTG 
Leu 


AAC 
Asn 


GTT 
Val 
475 


1441 


35 


CTC GGT GTT 
Leu Gly Val 


CCG 
Pro 


GGC 
Gly 
480 


ACC 
Thr 


CCC 
Pro 


GGC 
Gly 


ATG 
Met 


TTC 
Phe 
485 


GAG TTC 
Glu Phe 


TAC 
Tyr 


CGC 
Arg 


GAG 
Glu 
490 


ATG 
Met 


1469 


40 


GAG CAG TGG 
Glu Gin Trp 


ATG 
Met 
495 


CGG 
Arg 


AGC 
Ser 


CAC 
His 


TAC 
Tyr 


AAC 
Asn 
500 


AAC 
Asn 


GAC GAC 
Asp Asp 


GCC 
Ala 


ACC 
Thr 
505 


TTC 
Phe 


CGG 
Arg 


1537 




CCC GAG TGG 
.Pro Glu Trp 
510 


TCG 
Ser 


AAG 
Lys 


GGG 
Gly 


TGG 
Trp 


GCG 
Ala 
515 


TTC 
Phe 


GGT 
Gly 


CCC GAC 
Pro Asp 


CCG 
Pro 
520 


TAC 
Tyr 


ACC 
Thr 


GAC 
Asp 


1585 


45 


AAC GAC ATC 
Asn Asp He 
525 


GTC 
Val 


ACG 
Thr 


AAC 
Asn 


AAG 
Lys 
530 


ATG 
Met 


CGC 
Arg 


GCC 
Ala 


ACC TAC 
Thr Tyr 
535 


ATC 
He 


GAA 
Glu 


GGT 
Gly 


GTC 
Val 


1633 


50 


CCG ACG ACC 
Pro Thr Thr 
540 


GAG 
Glu 


AAC 
Asn 


TGG 
Trp 
545 


GAC 
Asp 


ACC 
Thr 


GCG 
Ala 


CGC 
Arg 


GCT CGG 
Ala Arg 
550 


TAC 
Tyr 


AAC 
Asn 


CAG 
Gin 


ATC 
He 
555 


1681 




GAC CCG CAT 
Asp Pro His 


CGC 
Arg 


GTG 
Val 
560 


TTC 
Phe 


ACC 
Thr 


AAC 
Asn 


GGA 
Gly 


TTC 
Phe 
565 


ATG GAC 
Met Asp 


AAG 
Lys 


CTG 
Leu 


CTT 
Leu 
570 


CCG 
Pro 


1729 



(2) INFORMATION ZU SEQ ID NO: 19: 
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(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 571 Aminosauren 

(B) ART: Aminosaure 

5 (D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 



10 



15 



20 



25 



30 



35 



40 



45 



50 



Met Thr Met lie Thr Pro Ser Leu His Ala Ser Thr Gly Pro Val Ala 
I 5 10 15 

Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn Asp He Ala Leu Phe Gin 
20 25 30 

Gin Ala Tyr Gin Asn Trp Ser Lys Glu He Met Leu Asp Ala Thr Trp 
35 40 45 

Val Cys Ser Pro Lys Thr Pro Gin Asp Val Val Arg . Leu Ala Asn Trp 
50 55 60 

Ala His Glu His Asp Tyr Lys He Arg Pro Arg Gly~Ala~Mee His Gly 
65 70 75 BO 

Trp Thr Pro Leu Thr Val Glu Lys Gly Ala Asn Val Glu Lys Val He 
85 90 95 

Leu Ala Asp Thr Met Thr His Leu Asn Gly He Thr Val Asn Thr Gly 
100 105 HO 

Gly Pro Val Ala Thr Val Thr Ala Gly Ala Gly Ala Ser He Glu Ala 
H5 120 125 

He Val Thr Glu Leu Gin Lys His Asp Leu Gly Trp Ala Asn Leu Pro 
130 135 140 

Ala Pro Gly Val Leu Ser He Gly Gly Ala Leu Ala Val Asn Ala His 
145 150 155 160 

Glv Ala Ala Leu Pro Ala Val Gly Gin Thr Thr Leu Pro Gly His Thr 
165 170 175 

Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu Leu Thr Ala Val Val Trp 
180 185 190 

Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr Gin Arg Asn Asp Pro Arg 
195 200 205 

He Thr Pro Leu Leu Thr Asn Leu Gly Arg Cys Phe Leu Thr Ser Val 
210 215 220 

Thr Met Gin Ala Gly Pro Asn Phe Arg Gin Arg Cys Gin Ser Tyr Thr 
225 230 235 240 

Asp He Pro Trp Arg Glu Leu Phe Ala Pro Lys Gly Ala Asp Gly Arg 



245 



250 



55 



Thr Phe Glu Lys Phe Val Ala Glu Ser Gly Gly Ala Glu Ala He Trp 
260 265 270 
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10 



15 



Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys Val Trp Thr Val Ser Pro 
275 280 265 

Thr Lys Pro Asp Ser Ser Asn Glu Val Gly Ser Leu Gly Ser Ala Gly 
290 295 300 

Ser Leu Val Gly Lys Pro Pro Gin Ala Arg Glu Val Ser Gly Pro Tyr 
305 310 315 320 

Asn Tyr He Phe Ser Asp Asn Leu Pro Glu Pro He Thr Asp Met He 
325 330 335 

Gly Ala He Asn Ala Gly Asn Pro Gly He Ala Pro Leu Phe Gly Pro 
340 345 350 

Ala Met Tyr Glu He Thr Lys Leu Gly Leu Ala Ala Thr Asn Ala Asn 
355 360 365 

Asp He Trp Gly Trp Ser Lys Asp Val Gin Phe Tyr He Lys Ala Thr 
370 375 380 

Thr Leu Arg Leu Thr Glu Gly Gly Gly Ala Val Val Thr Ser Arg Ala 
385 390 395 __ 400 

Asn He Ala Thr Val He Asn Asp Phe Thr Glu Trp Phe His Glu Arg 
405 410 415 

He Glu Phe Tyr Arg Ala Lys Gly Glu Phe Pro Leu Asn Gly Pro Val 
420 425 430 

Glu He Arg Cys Cys Gly Leu Asp Gin Ala Ala Asp Val Lys Val Pro 
30 435 440 445 

Ser Val Gly Pro Pro Thr He Ser Ala Thr Arq Pro Arg Pro Asp His 
450 455 460 



20 



25 



35 



40 



45 



50 



55 



Pro Asp Trp Asp Val Ala He Trp Leu Asn Val Leu Gly Val Pro Gly 
465 470 475 480 

Thr Pro Gly Met Phe Glu Phe Tyr Arg Glu Met Glu Gin Trp Met Arg 
485 490 495 

Ser His Tyr Asn Asn Asp Asp Ala Thr Phe Arg Pro Glu Trp Ser Lys 
500 505 510 

Gly Trp Ala Phe Gly Pro Asp Pro Tyr Thr Asp Asn Asp lie Val Thr 
515 520 525. 

Asn Lys Met Arg Ala Thr Tyr He Glu Gly Val Pro Thr Thr Glu Asn 
530 535 540 

Trp Asp Thr Ala Arg Ala Arg Tyr Asn Gin He Asp Pro His Arg Val 
545 550 555 560 

Phe Thr Asn Gly Phe Met Asp Lys Leu Leu Pro 
565 570 

(2) INFORMATION ZU SEQ ID NO: 20: 
(i) SEQUEN2 CHARAKTERISTIKA: 
(A) LANGE: 1732 Basenpaare 
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(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

5 (ix) MERKMALE: 

(A) NAME/SCHLOSSEL: CDS 

(B) LAGE: 20.. 1732 

10 (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 



GAATTTAAGG GGAACATCG ATG ACC ATG ATT ACG CCA AGC TTG CAT GCC TCG 52 

Met Thr Met lie Thr Pro Ser Leu His Ala Ser 

15 15 10 

ACC GGG CCG GTC GCG CCG CTT CCG ACG CCG CCG AAC- TTC CCG AAC GAC 100 
Thr Gly Pro Val Ala Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn Asp 
15 20 25 

20 ATC GCG CTG TTC CAG CAG GCG TAC CAG AAC TGG TCC AAG GAG ATC ATG 14B 
He Ala Leu Phe Gin Gin Ala Tyr Gin Asn Trp Ser Lys Glu He Met 
30 35 40 



25 



30 



CTG GAC GCC ACT TGG GTC TGC TCG CCC AAG ACG CCG CAG GAT GTC GTT 196 
Leu Asp Ala Thr Trp Val Cys Ser Pro Lys Thr Pro Gin Asp Val Val 
45 50 5! 

CGC CTT GCC AAC TGG GCG CAC GAG CAC GAC TAC AAG ATC CGC CCG CGC 244 
Arg Leu AXa Asn Trp Ala His Glu His Asp Tyr Lys He Arg Pro Arg 
60 65 70 75 

GGC GCG ATG CAC GGC TGG ACC CCG CTC ACC GTG GAG AAG GGG GCC AAC 292 
•Gly Ala Met His Gly Trp Thr Pro Leu Thr Val Glu «ys Gly Ala Asn 
80 85 90 

GTC GAG AAG GTG ATC CTC GCC GAC ACG ATG ACG CAT CTG AAC GGC ATC 340 
35 Val Glu Lys Val He Leu Ala Asp Thr Met Thr His Leu Asn Gly He 
95 100 105 

ACG GTG AAC ACG GGC GGC CCC GTG GCT ACC GTC ACC GCC GGT GCC GGC 388 
Thr Val Asn Thr Gly Gly Pro Val Ala Thr Val Thr Ala Gly Ala Gly 
110 115 120 



40 



45 



GCC AGC ATC GAG GCG ATC GTC ACC GAA CTG CAG AAG CAC GAC CTC GGC 436 
Ala Ser He Glu Ala He Val Thr Glu Leu Gin Lys His Asp Leu Gly 
125 130 135 

TGG GCC AAC CTG CCC GCT CCG GGT GTG CTG TCG ATC GGT GGC GCC CTT 484 
Trp Ala Asn Leu Pro Ala Pro Gly Val Leu Ser He Gly Gly Ala Leu 
140 145 150 155 



GCG GTC AAC GCG CAC GGT GCG GCG CTG CCG GCC GTC GGC CAG ACC ACG 532 

Ala Val Asn Ala His Gly Ala Ala Leu Pro Ala Val Gly Gin Thr Thr 
so 160 165 170 

CTG CCC GGT CAC ACC TAC GGT TCG CTG AGC AAC CTG GTC ACC GAG CTG 580 

Leu Pro Gly His Thr Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu Leu 

175 18D 185 

55 
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ACC GCG GTC GTC TGG AAC GGC ACC ACC TAC GCA CTC GAG ACG TAC CAG 628 
Thr Ala Val Val Trp Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr Gin 
190 195 200 

CGC AAC GAT CCT CGG ATC ACC CCA CTG CTC ACC AAC CTC GGG CGC TGC 676 
Arg Asn Asp Pro Arg lie Thr Pro Leu Leu Thr Asn Leu Gly Arg Cys 
205 210 215 

TTC CTG ACC TCG GTG ACG ATG CAG GCC GGC CCC AAC TTC CGT CAG CGG 724 
w Phe Leu Thr Ser Val Thr Met Gin Ala Gly Pro Asn Phe Arg Gin Arg 

220 225 230 235 

TGC CAG AGC TAC ACC GAC ATC CCG TGG CGG GAA CTG TTC GCG CCG AAG 772 
Cys Gin Ser Tyr Thr Asp lie Pro Trp Arg Glu Leu Phe Ala Pro Lys 
240 245 250 

GGC GCC GAC GGC CGC ACG TTC GAG AAG TTC GTC GCG GAA TCG GGC GGC 820 
Gly Ala Asp Gly Arg Thr Phe Glu Lys Phe Val Ala Glu Ser Gly Gly 
255 260 265 

GCC GAG GCG ATC TGG TAC CCG TTC ACC GAG AAG CCG TGG ATG AAG GTG 868 
Ala Glu Ala~Ile Trp Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys Val 
270 275 280 

TGG ACG GTC TCG CCG ACC AAG CCG GAC TCG TCG AAC GAG GTC GGA AGC 916 
Trp Thr Val Ser Pro. Thr Lys Pro Asp Ser Ser Asn Glu Val Gly Ser 
285 290 295 

CTC GGC TCG GCG GGC TCC CTC GTC GGC AAG CCT CCG CAG GCG CGT GAG 964 
Leu Gly Ser Ala Gly Ser Leu Val Gly Lys Pro Pro Gin Ala Arg Glu 
300 305 310 315 

GTC TCC GGC CCG TAC AAC TAC ATC TTC TCC GAC AAC CTG CCG GAG CCC 1012 
Val Ser Gly Pro Tyr Asn Tyr lie Phe Ser Asp Asn Leu Pro Glu Pro 
320 325 330 

ATC ACC GAC ATG ATC GGC GCC ATC AAC GCC GGA AAC CCC GGA ATC GCA 1060 
lie Thr Asp Met lie Gly Ala lie Asn Ala Gly Asn Pro Gly He Ala 
335 340 345 

CCG CTG TTC GGC CCG GCG ATG TAC GAG ATC ACC AAG CTC GGG CTG GCC 1108 
Pro Leu Phe Gly Pro Ala Met Tyr Glu He Thr Lys Leu Gly Leu Ala 
350 355 360 

M GCG ACG AAT GCC AAC GAC ATC TGG GGC TGG TCG AAG GAC GTC CAG TTC 1156 

Ala Thr Asn Ala Asn Asp lie Trp Gly Trp Ser Lys Asp Val Gin Phe 
365 370 375 

TAC ATC AAG GCC ACG ACG TTG CGA CTC ACC GAG GGC GGC GGC GCC GTC 1204 
Tyr He Lys Ala Thr Thr Leu Arg Leu Thr Glu Gly Gly Gly Ala Val 
45 380 385 390 395 

GTC ACG AGC CGC GCC AAC ATC GCG ACC GTG ATC AAC GAC TTC ACC GAG 1252 
Val Thr Ser Arg Ala Asn He Ala Thr Val He Asn Asp Phe Thr Glu 
400 405 410 

TGG TTC CAC GAG CGC ATC GAG TTC TAC CGC GCG AAG GGC GAG TTC CCG 1300 
Trp Phe His Glu Arg He Glu Phe Tyr Arg Ala Lys Gly Glu Phe Pro 
415 420 425 

CTC AAC GGT CCG GTC GAG ATC CGC TGC TGC GGG CTC GAT CAG GCA GCC 1348 
55 Leu Asn Gly Pro Val Glu He Arg Cys Cys Gly Leu Asp Gin Ala Ala 

430 435 440 
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30 
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GAC GTC AAG GTG CCG TCG GTG GGC CCG CCG ACC ATC TCG GCG ACC CGT 1396 
Asp Val Lys Val Pro Ser Val Gly Pro Pro Thr lie Ser Ala Thr Arg 
5 445 450 455 

CCG CGT CCG GAT CAT CCG GAC TGG GAC GTC GCG ATC TGG CTG AAC GTT 144 4 

Pro Arg Pro Asp His Pro Asp Trp Asp Val Ala lie Trp Leu Asn Val 
460 465 470 475 

10 CTC GGT GTT CCG GGC ACC CCC GGC ATG TTC GAG TTC TAC CGC GAG ATG 1492 
Leu Gly Val Pro Gly Thr Pro Gly Met Phe Glu Phe Tyr Arg Glu Met 
480 485 490 



15 



20 



GAG CAG TGG ATG CGG AGC CAC TAC AAC AAC GAC GAC GCC ACC TTC CGG 1540 
Glu Gin Trp_Met Arg Ser His Tyr Asn Asn Asp Asp Ala Thr Phe Arg 
495 * 500 505 

CCC GAG TGG TCG AAG GGG TGG GCG TTC GGT CCC GAC CCG TAC ACC GAC 1588 
Pro Glu Trp Ser Lys Gly Trp Ala Phe Gly Pro Asp Pro Tyr Thr Asp 
510 515 520 

AAC GAC ATC GTC ACG AAC AAG ATG CGC GCC ACC TAC ATC GAA GGT GTC 1636 
ASn Asp lie Val Thr Ash Lys Met Arg Ala Thr Tyr He Glu Gly Val 
525 530 535 

CCG ACG ACC GAG AAC TGG GAC ACC GCG CGC GCT CGG TAC AAC CAG ATC 1684 
25 pro Thr Thr Glu Asn Trp Asp Thr Ala Arg Ala Arg Tyr Asn Gin lie 
540 545 550 555 

GAC CCG CAT CGC GTG TTC ACC AAC GGA TTC ATG GAC AAG CTG CTT CCG 1732 
Asp Pro His Arg Val Phe Thr Asn Gly Phe Met Asp Lys Leu Leu Pro 
560 565 570 

30 

(2) INFORMATION ZU SEQ ID NO: 21: 
(j) SEQUENZ CHARAKTERISTIKA: 

35 

(A) LANGE: 571 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

40 (jj) ART DES MOLEK0LS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 



45 



50 



55 
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Met Thr Met He Thr Pro Ser Leu His Ala Ser Thr Gly Pro Val Ala 
15 10 15 

Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn Asp lie Ala Leu Phe Gin 
20 25 30 

Gin Ala Tyr Gin Asn Trp Ser Lys Glu lie Met Leu Asp Ala Thr Trp 
35 40 45 

Val Cys Ser Pro Lys Thr Pro Gin Asp Val Val Arg Leu Ala Asn Trp 
50 55 60 

Ala His Glu His Asp Tyr Lys He Arg Pro Arg Gly Ala Met His Gly 
65 70 75 80 

Trp Thr Pro Leu Thr Val Glu Lys Gly Ala Asn Val Glu Lys Val lie 
B5 90 M 
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Leu Ala Asp Thr Met Thr His Leu Asn Gly He Thr Val Asn Thr Gly 
100 105 110 

Gly Pro Val Ala Thr Val Thr Ala Gly Ala Gly Ala Ser He Glu Ala 
115 120 125 

He Val Thr Glu Leu Gin Lys His Asp Leu Gly Trp Ala Asn Leu Pro 
130 135 140 

Ala Pro Gly Val Leu Ser He Gly Gly Ala Leu Ala Val Asn Ala His 
145 150 155 160 

Gly Ala Ala Leu Pro Ala Val Gly Gin Thr Thr Leu Pro Gly His Thr 
165 170 175 

Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu Leu Thr Ala Val Val Trp 
180 185 190 

Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr Gin Arg Asn Asp Pro Arg 
195 200 205 

He Thr Pro Leu Leu Thr Asn Leu Gly Arg Cys Phe Leu Thr Ser Val 
210 " ~ ""215" 220' 

Thr Met Gin Ala Gly Pro Asn Phe Arg Gin Arg Cys Gin Ser Tyr Thr 
225 230 235 240 

Asp He Pro Trp Arg Glu Leu Phe Ala Pro Lys Gly Ala Asp Gly Arg 
245 250 255 

Thr Phe Glu Lys Phe Val Ala Glu Ser Gly Gly Ala Glu Ala He Trp 
260 265 270 

Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys Val Trp Thr Val Ser Pro 
275 280 285 

Thr Lys Pro Asp Ser Ser Asn Glu Val Gly Ser Leu Gly Ser Ala Gly 
290 295 300 

Ser Leu Val Gly Lys Pro Pro Gin Ala Arg Glu Val Ser Gly Pro Tyr 
305 310 315 320 

Asn Tyr He Phe Ser Asp Asn Leu Pro Glu Pro He Thr Asp Met He 
325 330 335 

Gly Ala He Asn Ala Gly Asn Pro Gly He Ala Pro Leu Phe Gly Pro 
340 345 350 

Ala Met Tyr Glu He Thr Lys Leu Gly Leu Ala Ala Thr Asn Ala Asn 
355 360 365 

Asp He Trp Gly Trp Ser Lys Asp Val Gin Phe Tyr He Lys Ala Thr 
370 375 380 

Thr Leu Arg Leu Thr Glu Gly Gly Gly Ala Val Val Thr Ser Arg Ala 
385 390 395 400 

Asn He Ala Thr Val He Asn Asp Phe Thr Glu Trp Phe His Glu Arg 
405 410 415 

He Glu Phe Tyr Arg Ala Lys Gly Glu Phe Pro Leu Asn Gly Pro Val 
420 425 430 
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Glu lie Arg Cys Cys Gly Leu Asp Gin Ala Ala Asp Val Lys Val Pro 
435 440 445 

Ser Val Gly Pro Pro Thr He Ser Ala Thr Arg Pro Arg Pro Asp His 
450 455 460 

Pro Asp Trp Asp Val Ala He Trp Leu Asn Val Leu Gly Val Pro Gly 
465 470 475 480 

Thr Pro Gly Met Phe Glu Phe Tyr Arg Glu Met Glu Gin Trp Met Arg 
485 490 " 495 

Ser His Tyr Asn Asn Asp Asp Ala Thr Phe Arg Pro Glu Trp Ser Lys 
500 505 510 

Gly Trp Ala Phe Gly Pro Asp Pro Tyr Thr Asp Asn Asp He Val Thr 
515 * 520 525 

Asn Lys Met Arg Ala Thr Tyr He Glu Gly Val Pro Thr Thr Glu Asn 
530 535 540 

Trp Asp Thr Ala Arg Ala Arg Tyr Asn Gin He Asp Pro His Arg Val 

_ 545 1- 550- - -555_ ... . 560 

Phe Thr Asn Gly Phe Met Asp Lys Leu Leu Pro 
565 570 

(2) INFORMATION ZU SEQ ID NO: 22: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1726 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 20..1726 

(xi) SEQUENZ BESCHREIBUNG: SEQ ID NO: 22: 



50 



55 
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GAATTTAAGG GGAACATCG ATG AGT AAT CAC CAT GGG CAT GCC TCG'ACC GGG 

Met Ser Asn His His Gly His Ala Ser Thr Gly 
15 10 

CCG GTC GCG CCG CTT CCG ACG CCG CCG AAC TTC CCG AAC GAC ATC GCG 
Pro Val Ala Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn Asp He Ala 
15 20 25 

CTG TTC GAG CAG GCG TAC CAG AAC TGG TCC AAG GAG ATC ATG CTG GAC 
Leu Phe Gin Gin Ala Tyr Gin Asn Trp Ser Lys Glu He Met Leu Asp 
30 35 40 

GCC ACT TGG GTC TGC TCG CCC AAG ACG CCG CAG GAT GTC GTT CGC CTT 
Ala Thr Trp Val Cys Ser Pro Lys Thr Pro Gin Asp Val Val Arg Leu 
45 50 55 

GCC AAC TGG GCG CAC GAG CAC GAC TAC AAG ATC CGC CCG CGC GGC GCG 
Ala Asn Trp Ala His Glu His Asp Tyr Lys He Arg Pro Arg Gly Ala 
60 « 70 75 
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ATG CAC GGC TGG ACC CCG CTC ACC GTG GAG AAG GGG GCC AAC GTC GAG 292 
Met His Gly Trp Thr Pro Leu Thr Val Glu Lys Gly Ala Asn Val Glu 
80 85 90 

AAG GTG ATC CTC GCC GAC ACG ATG ACG CAT CTG AAC GGC ATC ACG GTG 340 
Lys Val He Leu Ala Asp Thr Met Thr His Leu Asn Gly He Thr Val 
95 100 105 

AAC ACG GGC GGC CCC GTG GCT ACC GTC ACC GCC GGT GCC GGC GCC AGC 388 
Asn Thr Gly Gly Pro Val Ala Thr Val Thr Ala Gly Ala Gly Ala Ser 
110 115 120 

ATC GAG GCG ATC GTC ACC GAA CTG CAG AAG CAC GAC CTC GGC TGG GCC 436 
He Glu Ala He Val Thr Glu Leu Gin Lys His Asp Leu Gly Trp Ala 
125 130 135 

AAC CTG CCC GCT CCG GGT GTG CTG TCG ATC GGT GGC GCC CTT GCG GTC 484 
Asn Leu Pro Ala Pro Gly Val Leu Ser He Gly Gly Ala Leu Ala Val 
140 145 150 155 

AAC GCG CAC GGT GCG GCG CTG CCG GCC GTC GGC CAG ACC ACG CTG CCC 532 
Asn Ala His Gly Ala Ala Leu Pro Ala Val Gly Gin Thr Thr Leu Pro 
160 165 170 

GGT CAC ACC TAC GGT TCG CTG AGC AAC CTG GTC ACC GAG CTG ACC GCG 580 
Gly His Thr Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu Leu Thr Ala 
175 180 185 

GTC GTC TGG AAC GGC ACC ACC TAC GCA CTC GAG ACG TAC CAG CGC AAC 628 
Val Val Trp Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr Gin Arg Asn 
, 190 195 200 

GAT CCT CGG ATC ACC CCA CTG CTC ACC AAC CTC GGG wGC TGC TTC CTG 6*76 
Asp Pro Arg He Thr Pro Leu Leu Thr Asn Leu Gly Arg Cys Phe Leu 
205 210 215 

ACC TCG GTG ACG ATG CAG GCC GGC CCC AAC TTC CGT fcAG CGG TGC CAG 724 
Thr Ser Val Thr Met Gin Ala Gly Pro Asn Phe Arg Gin Arg Cys Gin 
220 225 230 235 

AGC TAC ACC GAC ATC CCG TGG CGG GAA CTG TTC GCG CCG AAG GGC GCC 772 
Ser Tyr Thr Asp He Pro Trp Arg Glu Leu Phe Ala Pro Lys Gly Ala 
240 245 250 

GAC GGC CGC ACG TTC GAG AAG TTC GTC GCG GAA TCG GGC GGC GCC GAG . 820 
Asp Gly Arg Thr Phe Glu Lys Phe Val Ala Glu Ser Gly Gly Ala Glu 
255 260 265 

GCG ATC TGG TAC CCG TTC ACC GAG AAG CCG TGG ATG AAG GTG TGG ACG 868 
Ala He Trp Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys Val Trp Thr 
270 275 280 

GTC TCG CCG ACC AAG CCG GAC TCG TCG AAC GAG GTC GGA AGC CTC GGC 916 
Val Ser Pro Thr Lys Pro Asp Ser Ser Asn Glu Val Gly Ser Leu Gly 
285 290 295 

TCG GCG GGC TCC CTC GTC GGC AAG CCT CCG CAG GCG CGT GAG GTC TCC 964 
Ser Ala Gly Ser Leu Val Gly Lys Pro Pro Gin Ala Arg Glu Val Ser 
300 305 310 315 

GGC CCG TAC AAC TAC ATC TTC TCC GAC AAC CTG CCG GAG CCC ATC ACC 1012 
Gly Pro Tyr Asn Tyr He Phe Ser Asp Asn Leu Pro Glu Pro He Thr 
320 325 330 
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15 



20 



GAC ATG ATC GGC GCC ATC AAC GCC GGA AAC CCC GGA ATC GCA CCG CTG 
Asp Met lie Gly Ala He Asn Ala Gly Asn Pro Gly He Ala Pro Leu 
5 335 340 345 

TTC GGC CCG GCG ATG TAC GAG ATC ACC AAG CTC GGG CTG GCC GCG ACG 1108 
Phe Gly Pro Ala Met Tyr Glu He Thr Lys Leu Gly Leu Ala Ala Thr 
350 355 360 

10 AAT GCC AAC GAC ATC TGG GGC TGG TCG AAG GAC GTC CAG TTC TAC ATC 1156 

Asn Ala Asn Asp He Trp Gly Trp Ser Lys Asp Val Gin Phe Tyr He 
365 370 375 

AAG GCC ACG ACG TTG CGA CTC ACC GAG GGC GGC GGC GCC GTC GTC ACG 1204 
Lys Ala Thr Thr Leu Arg Leu Thr Glu Gly Gly Gly Ala Val Val Thr 
380 - 385 390 395 

AGC CGC GCC AAC ATC GCG ACC GTG ATC AAC GAC TTC ACC GAG TGG TTC 1252 
Ser Arg Ala Asn He Ala Thr Val He Asn Asp Phe Thr Glu Trp Phe 
400 405 410 

CAC GAG CGC ATC GAG TTC TAC CGC GCG AAG GGC GAG TTC CCG CTC AAC 1300 
His Glu Arg He Glu Phe Tyr Arg Ala Lys Gly Glu Phe Pro Leu Asn 
415 420 425 

GGT CCG GTC GAG ATC CGC TGC TGC GGG CTC GAT CAG GCA GCC GAC GTC 1348 
Gly Pro Val Glu He Arg Cys Cys Gly Leu Asp Gin Ala Ala Asp Val 
25 430 435 440 

AAG GTG CCG TCG GTG GGC CCG CCG ACC ATC TCG GCG ACC CGT CCG CGT 1396 
Lys Val Pro Ser Val Gly Pro Pro Thr He Ser Ala Thr Arg Pro Arg 
445 450 455 

30 CCG GAT CAT CCG GAC TGG GAC GTC GCG ATC TGG CTG AAC GTT CTC GGT 1444 

Pro Asp His Pro Asp Trp Asp Val Ala He Trp Leu Asn Val Leu Gly 
460 465 470 475 

GTT CCG GGC ACC CCC GGC ATG TTC GAG TTC TAC CGC GAG ATG GAG CAG 1492 
35 Val Pro Gly Thr Pro Gly Met Phe Glu Phe Tyr Arg Glu Met Glu Gin 

480 485 490 

TGG ATG CGG AGC CAC TAC AAC AAC GAC GAC GCC ACC TTC CGG CCC GAG 1540 
Trp Met Arg Ser His Tyr Asn Asn Asp Asp Ala Thr Phe Arg Pro Glu 
495 * 500 505 

TGG TCG AAG GGG TGG GCG TTC GGT CCC GAC CCG TAC ACC GAC AAC GAC 1588 
Trp Ser Lys Gly Trp Ala Phe Gly Pro Asp Pro Tyr Thr Asp Asn Asp 
510 515 520 

ATC GTC ACG AAC AAG ATG CGC GCC ACC TAC ATC GAA GGT GTC CCG ACG 1636 
45 He Val Thr Asn Lys Met Arg Ala Thr Tyr He Glu Gly Val Pro Thr 

525 530 535 

ACC GAG AAC TGG GAC ACC GCG CGC GCT CGG TAC AAC CAG ATC GAC CCG 1684 
Thr Glu Asn Trp Asp Thr Ala Arg Ala Arg Tyr Asn Gin He Asp Pro 
50 540 545 550 555 

CAT CGC GTG TTC ACC AAC GGA TTC ATG GAC AAG CTG CTT CCG 1726 
His Arg Val Phe Thr Asn Gly Phe Met Asp Lys Leu Leu Pro 
560 565 



40 



55 



(2) INFORMATION ZU SEQ ID NO: 23: 
(i) SEQUEN2 CHARAKTERISTIKA: 



32 



EP 0 698 102 B1 



(A) LANGE: 569 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

5 (ii) ART DES MOLEKQLS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: 



10 



Met Ser Asn His His Gly His Ala Ser Thr Gly Pro Val Ala Pro Leu 
1 10 15 

Pro Thr Pro Pro Asn Phe Pro Asn Asp He Ala Leu Phe Gin Gin Ala 
20 25 30 



15 



Tyr Gin Asn Trp Ser Lys Glu He Met Leu Asp Ala Thr Trp Val Cys 
* 35 40 45 



Ser Pro Lys Thr Pro Gin Asp Val Val Arg Leu Ala Asn Trp Ala His 
50 55 60 



20 



Glu His Asp Tyr Lys He Arg Pro Arg Gly Ala Met His Gly Trp Thr 
65 70 75 80 



Pro Leu Thr Val Glu Lys Gly Ala Asn Val Glu Lys Val He Leu Ala 
85 90 95 



25 



Asp Thr Met Thr His Leu Asn Gly He Thr Val Asn Thr Gly Gly Pro 
100 105 110 



Val Ala Thr Val Thr Ala Gly Ala Gly Ala Ser He Glu Ala He Val 
115 120 125 



30 



Thr Glu Leu Gin Lys His Asp Leu Gly Trp Ala Asn Leu Pro Ala Pro 
130 135 140 



Gly Val Leu Ser He Gly Gly Ala Leu Ala Val Asn Ala His Gly Ala 
145 150 155 160 



35 



Ala Leu Pro Ala Val Gly Gin Thr Thr Leu Pro Gly His Thr Tyr Gly 
165 170 175 



40 



Ser Leu Ser Asn Leu Val Thr Glu Leu Thr Ala Val Val Trp Asn Gly 
180 185 190 

Thr Thr Tyr Ala Leu Glu Thr Tyr Gin Arg Asn Asp Pro Arg He Thr 
195 200 205 



45 



Pro Leu Leu Thr Asn Leu Gly Arg Cys Phe Leu Thr Ser Val Thr Met 
210 215 220 

Gin Ala Gly Pro Asn Phe Arg Gin Arg Cys Gin Ser Tyr Thr Asp He 

225 230 235 240 



50 



Pro Trp Arg Glu Leu. Phe Ala Pro Lys Gly Ala Asp Gly Arg Thr Phe 
245 250 255 

Glu Lys Phe Val Ala Glu Ser Gly Gly Ala Glu Ala He Trp Tyr Pro 
260 265 270 
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Phe Thr Glu Lys Pro Trp Met Lys Val Trp Thr Val Ser Pro Thr Lys 
275 280 285 

Pro Asp Ser Ser Asn Glu Val Gly Ser Leu Gly Ser Ala Gly Ser Leu 
290 295 300 

Val Gly Lys Pro Pro Gin Ala Arg Glu Val Ser Gly Pro Tyr Asn Tyr 
305 310 315 320 

He Phe Ser Asp Asn Leu Pro Glu Pro He Thr Asp Met He Gly Ala 
325 330 335 

He Asn Ala Gly Asn Pro Gly He Ala Pro Leu Phe Gly Pro Ala Met 
-340 345 350 

Tyr Glu He Thr Lys Leu Gly Leu Ala Ala Thr Asn Ala Asn Asp lie 
355 360 365 

Trp Gly Trp Ser Lys Asp Val Gin Phe Tyr He Lys Ala Thr Thr Leu 
370 375 3B0 

Arg Leu Thr Glu Gly Gly Gly Ala Val Val Thr Ser Arg Ala Asn He 
385- 390 395 400 

Ala Thr Val He Asn Asp Phe Thr Glu Trp Phe His Glu Arg He Glu 
405 410 415 

Phe Tyr Arg Ala Lys Gly Glu Phe Pro Leu Asn Gly Pro Val Glu He 
420 425 430 

Arg Cys Cys Gly Leu Asp Gin Ala Ala Asp Val Lys Val Pro Ser Val 
435 440 445 

Gly Pro Pro Thr He Ser Ala Thr Arg Pro Arg Pro. Asp His Pro Asp 
450 455 460 

Trp Asp Val Ala He Trp Leu Asn Val Leu Gly Val Pro Gly Thr Pro 
465 470 475 480 

Gly Met Phe Glu Phe Tyr Arg Glu Met Glu Gin Trp Met Arg Ser His 
485 490 495 

Tyr Asn Asn Asp Asp Ala Thr Phe Arg Pro Glu Trp Ser Lys Gly Trp 
500 505* 510 

Ala Phe Gly Pro Asp Pro Tyr Thr Asp Asn Asp He Val Thr Asn Lys 
515 520 525 

Met Arg Ala Thr Tyr He Glu Gly Val Pro Thr Thr Glu Asn Trp Asp 
530 535 540 

Thr Ala Arg Ala Arg Tyr Asn Gin He Asp Pro His Arg Val Phe Thr 
545 550 . 555 560 

Asn Gly Phe Met Asp Lys Leu Leu Pro 
565 



(2) INFORMATION ZU SEQ ID NO: 24: 
(i) SEQUENZ CHARAKTERISTIKA: 
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(A) LANGE: 1728 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: CDS 

(B) LAGE: 19.. 1728 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 



AATTTGGAGG GGAACATT ATG ACT AAT CAT CAC CAT GGG CAT GCC TCG ACC 51 
15 Met Ser Asn His His His Gly His Ala Ser Thr 

1 5 10 

GGG CCG GTC GCG CCG CTT CCG ACG CCG CCG AAC TTC CCG AAC GAC ATC 99 
Gly Pro Val Ala Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn Asp lie 
15 20 25 

GCG CTG TTC CAG CAG GCG TAC CAG AAC TGG TCC AAG GAG ATC ATG CTG 147 
Ala Leu Phe Gin Gin Ala Tyr Gin Asn Trp Ser Lys Glu He Met Leu 
30 35 40 

25 GAC GCC ACT TGG GTC TGC TCG CCC AAG ACG CCG CAG GAT GTC GTT CGC 195 

Asp Ala Thr Trp Val Cys Ser Pro Lys Thr Pro Gin Asp Val Val Arg 
45 50 55 

CTT GCC AAC TGG GCG CAC GAG CAC GAC TAC AAG ATC CGC CCG CGC GGC 243 
Leu Ala Asn Trp Ala His Glu His Asp Tyr Lys He Arg Pro Arg Gly 
30 60 65 7C 75 

GCG ATG CAC GGC TGG ACC CCG CTC ACC GTG GAG AAG GGG GCC AAC GTC 291 
Ala Met His Gly Trp Thr Pro Leu Thr Val Glu Lys Gly Ala Asn Val 
80 85 90 

35 

GAG AAG GTG ATC CTC GCC GAC ACG ATG ACG CAT CTG AAC GGC ATC ACG 339 
Glu Lys Val He Leu Ala Asp Thr Met Thr His Leu Asn Gly He Thr 
95 100 105 

GTG AAC ACG GGC GGC CCC GTG GCT ACC GTC ACC GCC GGT GCC GGC GCC 387 
Val Asn Thr Gly Gly Pro Val Ala Thr Val Thr Ala Gly Ala Gly Ala 
110 115 120. 

AGC ATC GAG GCG ATC GTC ACC GAA CTG CAG AAG CAC GAC CTC GGC TGG 435 
Ser He Glu Ala He Val Thr Glu Leu Gin Lys His Asp Leu Gly Trp 
125 130 135 

GCC AAC CTG CCC GCT CCG GGT GTG CTG TCG ATC GGT GGC GCC CTT GCG 483 
Ala Asn Leu Pro Ala Pro Gly Val Leu Ser He Gly Gly Ala Leu Ala 
140 145 150 155 

50 GTC AAC GCG CAC GGT GCG GCG CTG CCG GCC GTC GGC CAG ACC ACG CTG 531 

Val Asn Ala His Gly Ala Ala Leu Pro Ala Val Gly Gin Thr Thr Leu 
160 165 170 

CCC GGT CAC ACC TAC GGT TCG CTG AGC AAC CTG GTC ACC GAG CTG ACC 579 
55 Pro Gly His Thr Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu Leu Thr 

175 180 185 
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GCG GTC GTC TGG AAC GGC ACC ACC TAC GCA CTC GAG ACG TAC CAG CGC 
Ala Val Val Trp Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr Gin Arg 
190 195 * 200 

AAC GAT CCT CGG ATC ACC CCA CTG CTC ACC AAC CTC GGG CGC TGC TTC 
Asn Asp Pro Arg lie Thr Pro Leu Leu Thr Asn Leu Gly Arg Cys Phe 
205 210 215 

CTG ACC TCG GTG ACG ATG CAG GCC GGC CCC AAC TTC CGT CAG CGG TGC 
Leu Thr Ser Val Thr Met Gin Ala Gly Pro Asn Phe Arg Gin Arg Cys 
220 225 230 235 

CAG AGC TAC ACC GAC ATC CCG TGG CGG GAA CTG TTC GCG CCG AAG GGC 
Gin Ser Tyr Thr Asp lie Pro Trp Arg Glu Leu Phe Ala Pro Lys Gly 
240 245 250 

GCC GAC GGC CGC ACG TTC GAG AAG TTC GTC GCG GAA TCG GGC GGC GCC 
Ala Asp Gly Arg Thr Phe Glu Lys Phe Val Ala Glu Ser Gly Gly Ala 
255 260 265 

GAG GCG ATC TGG TAC CCG TTC ACC GAG AAG CCG TGG ATG AAG GTG TGG 
Glu Ala He Trp Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys Val Trp 
270 275 280 

ACG GTC TCG CCG ACC AAG CCG GAC TCG TCG AAC GAG GTC GGA AGC CTC 
Thr Val Ser Pro Thr Lys Pro Asp Ser Ser Asn Glu Val Gly Ser Leu 
285 290 295 

GGC TCG GCG GGC TCC CTC GTC GGC AAG CCT CCG CAG GCG CGT GAG GTC 
Gly Ser Ala Gly Ser Leu Val Gly Lys Pro Pro Gin Ala Arg Glu Val 
300 305 310 315 

TCC GGC CCG TAC AAC TAC ATC TTC TCC GAC AAC CTG CCG GAG CCC ATC 
Ser Gly Pro Tyr Asn Tyr He Phe Ser Asp Asn Leu Pro Glu Pro He 
320 325 330 

ACC GAC ATG ATC GGC GCC ATC AAC GCC GGA AAC CCC GGA ATC GCA CCG 
Thr Asp Met He Gly Ala He Asn Ala Gly Asn Pro Gly He Ala Pro 
335 340 345 

CTG TTC GGC CCG GCG ATG TAC GAG ATC ACC AAG CTC GGG CTG GCC GCG 
Leu Phe Gly Pro Ala Met Tyr Glu He Thr Lys Leu Gly Leu Ala Ala 
350 355 360 

ACG AAT GCC AAC GAC ATC TGG GGC TGG TCG AAG GAC GTC CAG TTC TAC 
Thr Asn Ala Asn Asp He Trp Gly Trp Ser Lys Asp Val Gin Phe Tyr 
365 370 375 

ATC AAG GCC ACG ACG TTG CGA CTC ACC GAG GGC GGC GGC GCC GTC GTC 
He Lys Ala Thr Thr Leu Arg Leu Thr Glu Gly Gly Gly Ala Val Val 
380 385 390 395 

ACG AGC CGC GCC AAC ATC GCG ACC GTG ATC AAC GAC TTC ACC GAG TGG 
Thr Ser Arg Ala Asn He Ala Thr Val He Asn Asp Phe Thr Glu Trp 
400 405 410 

TTC CAC GAG CGC ATC GAG TTC TAC CGC GCG AAG GGC GAG TTC CCG CTC 
Phe His Glu Arg He Glu Phe Tyr Arg Ala Lys Gly Glu Phe Pro Leu 
415 420 425 

AAC GGT CCG GTC GAG ATC CGC TGC TGC GGG CTC GAT CAG GCA GCC GAC 
Asn Gly Pro Val Glu He Arg Cys Cys Gly Leu Asp Gin Ala Ala Asp 
430 435 440 
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GTC AAG GTG CCG TCG GTG GGC CCG CCG ACC ATC TCG GCG ACC CGT CCG 1395 
Val Lys Val Pro Ser Val Gly Pro Pro Thr lie Ser Ala Thr Arg Pro 
445 450 

CGT CCG GAT CAT CCG GAC TGG GAC GTC GCG ATC TGG CTG AAC GTT CTC 1443 
Arg Pro Asp His Pro Asp Trp Asp Val Ala He Trp Leu Asn Val Leu 
460 465 470 475 

GGT GTT CCG GGC ACC CCC GGC ATG TTC GAG TTC TAC CGC GAG ATG GAG 1491 
Gly Val Pro Gly Thr Pro Gly Met Phe Glu Phe Tyr Arg Glu Met Glu 
480 485 490 

CAG TGG ATG CGG AGC CAC TAC AAC AAC GAC GAC GCC ACC TTC CGG CCC 1539 
Gin Trp Met Arg Ser His Tyr Asn Asn Asp Asp Ala Thr Phe Arg Pro 
-- 495 500 505 

GAG TGG TCG AAG GGG TGG GCG TTC GGT CCC GAC CCG TAC ACC GAC AAC 1587 
Glu Trp Ser Lys Gly Trp Ala Phe Gly Pro Asp Pro Tyr Thr Asp Asn 
510 515 520 

GAC ATC GTC ACG AAC AAG ATG CGC GCC ACC TAC ATC GAA GGT GTC CCG 1635 
Asp He Val Thr Asn Lys Met Arg Ala Thr Tyr He Glu Gly Val Pro 
525 530 535 

ACG ACC GAG AAC TGG GAC ACC GCG CGC GCT CGG TAC AAC CAG ATC GAC 1683 
Thr Thr Glu Asn Trp Asp Thr Ala Arg Ala Arg Tyr Asn Gin He Asp 
540 545 550 555 



CCG CAT CGC GTG TTC ACC AAC GGA TTC ATG GAC AAG CTG CTT CCG 1728 
Pro His Arg Val Phe Thr Asn Gly Phe Met Asp Lys Leu Leu Pro 
30 560 565 570 



(2) INFORMATION ZU SEQ ID NO: 25: 
35 (i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 570 Aminosauren 

(B) ART: Aminosaure 
(D)TOPOLOGIE: linear 

40 . 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 
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Met Ser Asn His His His Gly His Ala Ser Thr Gly Pro Vai Ala Pro 

IS 10 15 

Leu Pro Thr Pro Pro Asn Phe Pro Asn Asp He Ala Leu Phe Gin Gin 

20 25 30 

Ala Tyr Gin Asn Trp Ser Lys Glu He Met Leu Asp Ala Thr Trp Val 

35 40 45 

Cys Ser Pro Lys Thr Pro Gin Asp Val Val Arg Leu Ala Asn Trp Ala 

50 55 60 

His Glu His Asp Tyr Lys He Arg Pro Arg Gly Ala Met His Gly Trp 

65 70 75 80 

Thr Pro Leu Thr Val Glu Lys Gly Ala Asn Val Glu Lys Val He Leu 

85 90 « 
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Ala Asp Thr Met Thr His Leu Asn Gly He Thr Val Asn Thr Gly Gly 
100 105 110 

Pro Val Ala Thr Val Thr Ala Gly Ala Gly Ala Ser He Glu Ala He 
115 120 125 

Val Thr Glu Leu Gin Lys His Asp Leu Gly Trp Ala Asn Leu Pro Ala 
130 135 140 



w 



Pro Gly Val Leu Ser He Gly Gly Ala Leu Ala Val Asn Ala His Gly 
145 150 155 160 



15 



Ala Ala Leu Pro Ala Val Gly Gin Thr Thr Leu Pro Gly His Thr Tyr 
165 - 170 175 

Gly Ser Leu Ser Asn Leu Val Thr Glu Leu Thr Ala Val Val Trp Asn 
180 185 190 



20 



Gly Thr Thr Tyr Ala Leu Glu Thr Tyr Gin Arg Asn Asp Pro Arg He 
195 200 205 

Thr Pro Leu Leu Thr Asn Leu Gly Arg Cys Phe Leu Thr Ser Val Thr 

210 - 215 - 220 



25 



Met Gin Ala Gly Pro Asn Phe Arg Gin Arg Cys Gin Ser Tyr Thr Asp 

225 230 235 240 

He Pro Trp Arg Glu Leu Phe Ala Pro Lys Gly Ala Asp Gly Arg Thr 

245 250 255 



30 



35 



40 



Phe Glu Lys Phe Val Ala Glu Ser Gly Gly Ala Glu Ala He Trp Tyr 
260 265 270 

Pro Phe Thr Glu Lys Pro Trp Met Lys Val Trp Thr Val Ser Pro Thr 
275 280 285 

Lys Pro Asp Ser Ser Asn Glu Val Gly Ser Leu Gly Ser Ala Gly Ser 
290 295 300 

Leu Val Gly Lys Pro Pro Gin Ala Arg Glu Val Ser Gly Pro Syr Asn 
305 310 315 320 

Tyr He Phe Ser Asp Asn Leu Pro Glu Pro He Thr Asp Met He Gly 
325 330 335 

Ala He Asn Ala Gly Asn Pro Gly He Ala Pro Leu Phe Gly Pro Ala 
340 345 350 



45 



Met Tyr Glu He Thr Lys Leu Gly Leu Ala Ala Thr Asn Ala Asn Asp 
355 360 365 



50 



He Trp Gly Trp Ser Lys Asp Val Gin Phe Tyr He Lys Ala Thr Thr 
370 375 380 

Leu Arg Leu Thr Glu Gly Gly Gly Ala Val Val Thr Ser Arg Ala Asn 
385 390 395 400 

He Ala Thr Val He Asn Asp Phe Thr Glu Trp Phe His Glu Arg He 
405 410 415 



55 



Glu Phe Tyr Arg Ala Lys Gly Glu Phe Pro Leu Asn Gly Pro Val Glu 
.420 425 430 
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lie Arg Cys Cys Gly Leu Asp Gin Ala Ala Asp Val Lys Val Pro Ser 
435 440 4 45 

Val Gly Pro Pro Thr lie Ser Ala Thr Arg Pro Arg Pro Asp His Pro 
450 455 460 

Asp Trp Asp Val Ala lie Trp Leu Asn Val Leu Gly Val Pro Gly Thr 
465 470 475 480 

Pro Gly Met Phe Glu Phe Tyr Arg Glu Met Glu Gin Trp Met Arg Ser 
485 490 495 

His Tyr Asn Asn Asp Asp Ala Thr Phe Arg Pro Glu Trp Ser Lys Gly 
500 505 510 

Trp Ala Phe Gly Pro Asp Pro Tyr Thr Asp Asn Asp He Val Thr Asn 
515 520 525 

Lys Met Arg Ala Thr Tyr He Glu Gly Val Pro Thr Thr Glu Asn Trp 
530 535 540 

Asp Thr- Ala Arg Ala Arg J£yr Asn Gin He Asp Pro His Arg Val Phe 
545 550 555 $60 

Thr Asn Gly Phe Met Asp Lys Leu Leu Pro 

25 565 570 



(2) INFORMATION ZU SEQ ID NO: 26: 
30 (|) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1741 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 
35 (D) TOPOLOGIE: linear 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 
40 (B)LAGE:20..1741 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 
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GAATTTAAGG GGAACATCG ATG AGT AAT ACG CGT AAA CGC AAG CGC CGT ACG 52 

Met Ser Asn Thr Arg Lys Arg Lys Arg Arg Thr 
1 5 10 

CAT GCC TCG ACC GGG CCG GTC GCG CCG CTT CCG ACG CCG CCG AAC TTC 100 
His Ala Ser Thr Gly Pro Val Ala Pro Leu Pro Thr Pro Pro Asn Phe 
15 20 25 

CCG AAC GAC ATC GCG CTG .TTC GAG GAG GCG TAC CAG AAC TGG TCC AAG 148 
Pro Asn Asp He Ala Leu Phe Gin Gin Ala Tyr Gin Asn Trp Ser Lys 
30 35 40 

GAG ATC ATG CTG GAC GCC ACT TGG GTC TGC TCG CCC AAG ACG CCG CAG 196 
Glu He Met Leu Asp Ala Thr Trp Val Cys Ser Pro Lys Thr Pro Gin 



45 

15 



50 55 



GAT GTC GTT CGC CTT GCC AAC TGG GCG CAC GAG CAC GAC TAC AAG ATC 244 
Asp Val Val Arg Leu Ala Asn Trp Ala His Glu His Asp Tyr Lys lie 
60 « 70 
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CGC CCG CGC GGC GCG ATG CAC GGC TGG ACC CCG CTC ACC GTG GAG AAG 292 
Arg Pro Arg Gly Ala Met His Gly Trp Thr Fro Leu Thr Val Glu Lys 
80 85 90 

GGG GCC AAC GTC GAG AAG GTG ATC CTC GCC GAC ACG ATG ACG CAT CTG 340 
Gly Ala Asn Val Glu Lys Val lie Leu Ala Asp Thr Met Thr His Leu 
95 100 105 

AAC GGC ATC ACG GTG AAC ACG GGC GGC CCC GTG GCT ACC GTC ACC GCC 388 
Asn Gly lie Thr Val Asn Thr Gly Gly Pro Val Ala Thr Val Thr Ala 
110 115 120 

GGT GCC GGC GCC AGC ATC GAG GCG ATC GTC ACC GAA CTG CAG AAG CAC 436 
Gly Ala Gly Ala Ser lie Glu Ala lie Val Thr Glu Leu Gin Lys His 
125 130 135 

GAC CTC GGC TGG GCC AAC CTG CCC GCT CCG GGT GTG CTG TCG ATC GGT 484 
Asp Leu Gly Trp Ala Asn Leu Pro Ala Pro Gly Val Leu Ser He Gly 
140 145 150 155 

GGC GCC CTT GCG GTC AAC GCG CAC GGT GCG GCG CTG CCG GCC GTC GGC 532 
Gly Ala Leu Ala Val Asn Ala His Gly Ala Ala Leu Pro Ala Val Gly 
160 165 170 

CAG ACC ACG CTG CCC GGT CAC ACC TAC GGT TCG CTG AGC AAC CTG GTC 580 
Gin Thr Thr Leu Pro Gly His Thr Tyr Gly Ser Leu Ser Asn Leu Val 
175 180 185 

ACC GAG CTG ACC GCG GTC GTC TGG AAC GGC ACC ACC TAC GCA CTC GAG 628 
Thr Glu Leu Thr Ala Val Val Trp Asn Gly Thr Thr Tyr Ala Leu Glu 
190 195 200 

ACG TAC CAG CGC AAC GAT CCT CGG ATC ACC CCA CTG CTC ACC AAC CTC 676 
Thr Tyr Gin Arg Asn Asp Pro Arg He Thr Pro Leu Leu Thr Asn Leu 
205 210 215 

GGG CGC TGC TTC CTG ACC TCG GTG ACG ATG CAG GCC GGC CCC AAC TTC 724 
Gly Arg Cys Phe Leu Thr Ser Val Thr Met Gin Ala Gly Pro Asn Phe 
220 225 230 235 

CGT CAG CGG TGC CAG AGC TAC ACC GAC ATC CCG TGG CGG GAA CTG TTC 772 
Arg Gin Arg Cys Gin Ser Tyr Thr Asp He Pro Trp Arg Glu Leu Phe 
240 245 250 

40 GCG CCG AAG GGC GCC GAC GGC CGC ACG TTC GAG AAG TTC GTC GCG GAA 820 
Ala Pro Lys Gly Ala Asp Gly Arg Thr Phe Glu Lys Phe Val Ala Glu 
255 260 265 

TCG GGC GGC GCC GAG GCG ATC TGG TAC CCG TTC ACC GAG AAG CCG TGG 868 
Ser Gly Gly Ala Glu Ala He Trp Tyr Pro Phe Thr Glu Lys Pro Trp 
45 270 275 280 

ATG AAG GTG TGG ACG GTC TCG CCG ACC AAG CCG GAC TCG TCG AAC GAG 916 
Met Lys Val Trp Thr Val Ser Pro Thr Lys Pro Asp Ser Ser Asn Glu 
285 290 295 

50 GTC GGA AGC CTC GGC TCG GCG GGC TCC CTC GTC GGC AAG CCT CCG CAG 964 
Val Gly Ser Leu Gly Ser Ala Gly Ser Leu Val Gly Lys Pro Pro Gin 
300 305 310 315 

GCG CGT GAG GTC TCC GGC CCG TAC AAC TAC ATC TTC TCC GAC AAC CTG 1012 
55 Ala Arg Glu Val Ser Gly Pro Tyr Asn Tyr He Phe Ser Asp Asn Leu 

320 325 330 
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CCG GAG CCC ATC ACC GAC ATG ATC GGC GCC ATC AAC GCC GGA AAC CCC 1060 
Pro Glu Pro He Thr Asp Met He Gly Ala He Asn Ala Gly Asn Pro 
335 340 345 

5 GGA ATC GCA CCG CTG TTC GGC CCG GCG ATG TAC GAG ATC ACC AAG CTC 1108 

Gly He Ala Pro Leu Phe Gly Pro Ala Met Tyr Glu He Thr Lys Leu 
350 355 360 

GGG CTG GCC GCG ACG AAT GCC AAC GAC ATC TGG GGC TGG TCG AAG GAC 1156 
10 Gly Leu Ala Ala Thr Asn Ala Asn Asp He Trp Gly Trp Ser Lys Asp 

365 370 375 

GTC CAG TTC TAC ATC AAG GCC ACG ACG TTG CGA CTC ACC GAG GGC GGC 1204 
Val Gin Phe Tyr He Lys Ala Thr Thr Leu Arg Leu Thr Glu Gly Gly 
380 385 390 395 

15 

GGC GCC GTC GTC ACG AGC CGC GCC AAC ATC GCG ACC GTG ATC AAC GAC 1252 
Gly Ala Val Val Thr Ser Arg Ala Asn He Ala Thr Val He Asn Asp 
400 405 410 

TTC ACC GAG TGG TTC CAC GAG CGC ATC GAG TTC TAC CGC GCG AAG GGC 1300 
20 Phe Thr Glu Trp Phe His Glu Arg He Glu Phe Tyr Arg Ala Lys Gly 
- - 415 420 425 

GAG TTC CCG CTC AAC GGT CCG GTC GAG ATC CGC TGC TGC GGG CTC GAT 1348 
Glu Phe Pro Leu Asn Gly Pro Val Glu He Arg Cys Cys Gly Leu Asp 
430 435 440 

25 

CAG GCA GCC GAC GTC AAG GTG CCG TCG GTG GGC CCG CCG ACC ATC TCG 1396 
Gin Ala Ala Asp Val Lys Val Pro Ser Val Gly Pro Pro Thr He Ser 
445 450 455 

GCG ACC CGT CCG CGT CCG GAT CAT CCG GAC TGG GAC GTC GCG ATC TGG 1444 
Ala Thr Arg Pro Arg Pro Asp His Pro Asp Trp Asp Val Ala He Trp 
460 465 470 475 

CTG AAC GTT CTC GGT GTT CCG GGC ACC CCC GGC ATG TTC GAG TTC TAC 1492 
Leu Asn Val Leu Gly Val Pro Gly Thr Pro Gly Met Phe Glu Phe Tyr 
480 485 490 

CGC GAG ATG GAG CAG TGG ATG CGG AGC CAC TAC AAC AAC GAC GAC GCC 1540 
Arg Glu Met Glu Gin Trp Met Arg Ser His Tyr Asn Asn Asp Asp Ala 
495 500 505 

40 ACC TTC CGG CCC GAG TGG TCG AAG GGG TGG GCG TTC GGT CCC GAC CCG 1588 

Thr Phe Arg Pro Glu Trp Ser Lys Gly Trp Ala Phe Gly Pro Asp Pro 
510 515 520 

TAC ACC GAC AAC GAC ATC GTC ACG AAC AAG ATG CGC GCC ACC TAC ATC 1636 
Tyr Thr Asp Asn Asp He Val Thr Asn Lys Met Arg Ala Thr Tyr He 
525 530 535 

GAA GGT GTC CCG ACG ACC GAG AAC TGG GAC ACC GCG CGC GCT CGG TAC 1684 
Glu Gly Val Pro Thr Thr Glu Asn Trp Asp Thr Ala Arg Ala Arg Tyr 
540 545 550 555 

AAC CAG ATC GAC CCG CAT CGC GTG TTC ACC AAC GGA TTC ATG GAC AAG 1732 
Asn Gin He Asp Pro His Arg Val Phe Thr Asn Gly Phe Met Asp Lys 
560 565 570 
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(2) INFORMATION ZU SEQ ID NO: 27: 

(i) SEQUENZ CHARAKTERISTIKA: 

5 (A) LANGE: 574 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKQLS: Protein 

10 (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 
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Met. Ser Asn Thr Arg Lys Arg Lys Arg Arg Thr His Ala Ser Thr Gly 
1 5 10 15 

Pro Val Ala Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn Asp lie Ala 
20 25 30 



10 



15 



Leu Phe Gin Gin Ala Tyr Gin Asn Trp Ser Lys Glu lie Met Leu Asp 
35 40 45 

Ala Thr Trp Val Cys Ser Pro Lys Thr Pro Gin Asp Val Val Arg Leu 
50 55 60 

Ala Asn Trp Ala His Glu His Asp Tyr Lys He Arg Pro Arg Gly Ala » 
65 70 75 80 

Met His Gly Trp Thr Pro Leu Thr Val Glu Lys Gly Ala Asn Val Glu 
65 90 95 



20 



25 



Lys Val He Leu Ala Asp Thr Met Thr His Leu Asn Gly He Thr Val 
100 105 110 

Asn Thr Gly Gly Pro Val Ala Thr Val Thr Ala Gly Ala Gly Ala Ser 
115 120 125 

He Glu Ala He Val Thr Glu Leu Gin Lys His Asp Leu Gly Trp Ala 
130 135 140 

Asn Leu Pro Ala Pro Gly Val Leu Ser He Gly Gly Alt Leu Ala Val 
145 150 155 160 
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Asn Ala His Gly Ala Ala Leu Pro Ala Val Gly Gin Thr Thr Leu Pro 
165 170 175 

Gly His Thr Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu Leu Thr Ala 
180 185 190 

Val Val Trp Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr Gin Arg Asn 
195 200 205 

Asp Pro Arg He Thr Pro Leu Leu Thr Asn Leu Gly Arg Cys Phe Leu 
210 215 220 

Thr Ser Val Thr Met Gin Ala Gly Pro Asn Phe Arg Gin Arg Cys Gin 
225 230 235 240 

Ser Tyr Thr Asp He Pro Trp Arg Glu Leu Phe Ala Pro Lys Gly Ala 
245 250 255 

Asp Gly Arg Thr Phe Glu Lys Phe Val Ala Glu Ser Gly Gly Ala Glu 
260 265 270 
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Ala lie Trp Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys Val Trp Thr 
275 280 285 

Val Ser Pro Thr Lys Pro Asp Ser Ser Asn Glu Val Gly Ser Leu Gly 
290 295 300 

Ser Ala Gly Ser Leu Val Gly Lys Pro Pro Gin Ala Arg Glu Val Ser 
305 310 315 320 

Gly Pro Tyr Asn Tyr lie Phe Ser Asp Asn Leu Pro Glu Pro He Thr 
325 330 335 

Asp Met He Gly Ala lie Asn Ala Gly Asn Pro Gly He Ala Pro Leu 
340 345 350 

Phe Gly Pro Ala Met Tyr Glu He Thr Lys Leu Gly Leu Ala Ala Thr 
355 360 365 

Asn Ala Asn Asp He Trp Gly Trp Ser Lys Asp Val Gin Phe Tyr lie 
370 375 380 

Lys Ala Thr Thr Leu Arg Leu Thr Glu Gly Gly Gly Ala Val Val Thr 
365 390 395 400 

Ser Arg Ala Asn He Ala Thr Val He Asn Asp Phe Thr Glu Trp Phe 
405 410 415 

His Glu Arg lie Glu Phe Tyr Arg Ala Lys Gly Glu Phe Pro Leu Asn 
420 425 * 430 

Gly Pro Val Glu He Arg Cys Cys Gly Leu Asp Gin Ala Ala Asp Val 
435 440 445 

Lys Val Pro Ser Val Gly Pro Pro Thr He Ser Ala Thr Arg Pro Arg 
450 455 460 

Pro Asp His Pro Asp Trp Asp Val Ala He Trp Leu Asn Val Leu Gly 
465 470 475 480 

Val Pro Gly Thr Pro Gly Met Phe Glu Phe Tyr Arg Glu Met Glu Gin 
465 490 495 

Trp Met Arg Ser His Tyr Asn Asn Asp Asp Ala Thr Phe Arg Pro Glu 
500 505 510 ' 

Trp Ser Lys Gly Trp Ala Phe Gly Pro Asp Pro Tyr Thr Asp Asn Asp 
515 520 525 

He Val Thr Asn Lys Met Arg Ala Thr Tyr He Glu Gly Val Pro Thr 
530 535 540 

Thr Glu Asn Trp Asp Thr Ala Arg Ala Arg Tyr Asn Gin He Asp Pro 
545 550 555 560 



His Arg Val Phe Thr Asn Gly Phe Met Asp Lys Leu Leu Pro 
565 570 



(2) INFORMATION ZU SEQ ID NO: 28: 
(i) SEQUENZ CHARAKTERISTIKA: 
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10 



(A) LANGE: 1731 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANG FORM: Einzel 

(D) TOPOLOGIE: linear 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 25..1731 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 



GAATTCACAC AGGAAACAGA ATTC ATG GTT ATG CAC CAT GGG CAT GCC TCG 51 
15 Met Val Met His His Gly His Ala Ser 

15 

ACC GGG CCG GTC GCG CCG CTT CCG ACG CCG CCG AAC TTC CCG AAC GAC 99 
Thr Gly Pro Val Ala Pro Leu Pro Thr Pro Pro Asn Phe Pro Asn Asp 
10 15 20 25 

20 

ATC GCG CTG TTC CAG CAG GCG TAC CAG AAC TGG TCC AAG GAG ATC ATG 147 
lie Ala Leu Phe Gin Gin Ala Tyr Gin Asn Trp Ser Lys Glu He Met 
30 35 t 40 

CTG GAC GCC ACT TGG GTC TGC TCG CCC AAG ACG CCG CAG GAT GTC GTT 195 
25 Leu Asp Ala Thr Trp Val Cys Ser Pro Lys Thr Pro Gin Asp Val Val 
45 50 55 

CGC CTT GCC AAC TGG GCG CAC GAG CAC GAC TAC AAG ATC CGC CCG CGC 243 
Arg Leu Ala Asn Trp Ala His Glu His Asp Tyr Lys He Arg Pro Axg 
60 65 70 

30 

GGC GCG ATG CAC GGC TGG ACC CCG CTC ACC GTG GAG AAG GGG GCC AAC 291 
Gly Ala Met His Gly Trp Thr Pro Leu Thr Val Glu Lys Gly Ala Asn 
75 80 85 

GTC GAG AAG GTG ATC CTC GCC GAC ACG ATG ACG CAT CTG AAC GGC ATC 339 
35 Val Glu Lys Val He Leu Ala Asp Thr Met Thr His Leu Asn Gly He 
90 95 100 105 

ACG GTG AAC ACG GGC GGC CCC GTG GCT ACC GTC ACC GCC GGT GCC GGC 387 
Thr Val Asn Thr Gly Gly Pro Val Ala Thr Val Thr Ala Gly Ala Gly 
40 HO 115 120 

GCC AGC ATC GAG GCG ATC GTC ACC GAA CTG CAG AAG CAC GAC CTC GGC 435 
Ala Ser He Glu Ala He Val Thr Glu Leu Gin Lys His Asp Leu Gly 
125 130 135 

45 TGG GCC AAC CTG CCC GCT CCG GGT GTG CTG TCG ATC GGT GGC GCC CTT 4 83 

Trp Ala Asn Leu Pro Ala Pro Gly Val Leu Ser He Gly Gly Ala Leu 
140 145 150 

GCG GTC AAC GCG CAC GGT GCG GCG CTG CCG GCC GTC GGC CAG ACC ACG 531 
Ala Val Asn Ala His Gly Ala Ala Leu Pro Ala Val Gly Gin Thr Thr 
50 155 160 165 

CTG CCC GGT CAC ACC TAC GGT TCG CTG AGC AAC CTG GTC ACC GAG CTG 579 

Leu Pro Gly His Thr Tyr Gly Ser Leu Ser Asn Leu Val Thr Glu Leu 
170 175 180 185 

55 
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ACC GCG GTC GTC TGG AAC GGC ACC ACC TAC GCA CTC GAG ACG TAC CAG 627 
Thr Ala Val Val Trp Asn Gly Thr Thr Tyr Ala Leu Glu Thr Tyr Gin 
190 195 200 

CGC AAC GAT CCT CGG ATC ACC CCA CTG CTC ACC AAC CTC GGG CGC TGC 675 
Arg Asn Asp Pro Arg lie Thr Pro Leu Leu Thr Asn Leu Gly Arg Cys 
205 210 215 

TTC CTG ACC TCG GTG ACG ATG CAG GCC GGC CCC AAC TTC CGT CAG CGG 723 
Phe Leu Thr Ser Val Thr Met Gin Ala Gly Pro Asn Phe Arg Gin Arg 
220 225 230 

TGC CAG AGC TAC ACC GAC ATC CCG TGG CGG GAA CTG TTC GCG CCG AAG 771 
Cys Gin Ser Tyr Thr Asp lie Pro Trp Arg Glu Leu Phe Ala Pro Lys 
235 240 245 

GGC GCC GAC GGC CGC ACG TTC GAG AAG TTC GTC GCG GAA TCG GGC GGC 819 
Gly Ala Asp Gly Arg Thr Phe Glu Lys Phe Val Ala Glu Ser Gly Gly 
250 255 260 265 

GCC GAG GCG ATC TGG TAC CCG TTC ACC GAG AAG CCG TGG ATG AAG GTG 867 
Ala Glu Ala lie Trp Tyr Pro Phe Thr Glu Lys Pro Trp Met Lys Val 
270 275 280 

TGG ACG GTC TCG CCG ACC AAG CCG GAC TCG TCG AAC GAG GTC GGA AGC 915 
Trp Thr Val Ser Pro Thr Lys Pro Asp Ser Ser Asn Glu Val Gly Ser 
265 290 295 

CTC GGC TCG GCG GGC TCC CTC GTC GGC AAC CCT CCG CAG GCG CGT GAG 963 
Leu Gly Ser Ala Gly Ser Leu Val Gly Lys Pro Pro Gin Ala Arg Glu 
300 305 310 

30 GTC TCC GGC CCG TAC AAC TAC ATC TTC TCC GAC AAC CTG CCG GAG CCC 1011 

Val Ser Gly Pro Tyr Asn Tyr He Phe Ser Asp Asn Leu Pro Glu Pro 
315 320 325 

ATC ACC GAC ATG ATC GGC GCC ATC AAC GCC GGA AAC CCC GGA ATC GCA 1059 
lie Thr Asp Met lie Gly Ala lie Asn Ala Gly Asn Pro Gly lie Ala 
35 330 335 340 345 

CCG CTG TTC GGC CCG GCG ATG TAC GAG ATC ACC AAG CTC GGG CTG GCC 1107 
Pro Leu Phe Gly Pro Ala Met Tyr Glu He Thr Lys Leu Gly Leu Ala 
350 * 355 360 
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GCG ACG AAT GCC AAC GAC ATC TGG GGC TGG TCG AAG GAC GTC CAG TTC 1155 
Ala Thr Asn Ala Asn Asp He Trp Gly Trp Ser Lys Asp Val Gin Phe 
365 370 375 

TAC ATC AAG GCC ACG ACG TTG CGA CTC ACC GAG GGC GGC GGC GCC GTC 1203 
Tyr He Lys Ala Thr Thr Leu Arg Leu Thr Glu Gly Gly Gly Ala Val 
380 385 390 

GTC ACG AGC CGC GCC AAC ATC GCG ACC GTG ATC AAC GAC TTC ACC GAG 1251 
Val Thr Ser Arg Ala Asn He Ala Thr Val He Asn Asp Phe Thr Glu 
395 400 405 

TGG TTC CAC GAG CGC ATC GAG TTC TAC CGC GCG AAG GGC GAG TTC CCG 1299 
Trp Phe His Glu Arg He Glu Phe Tyr Arg Ala Lys Gly Glu Phe Pro 
410 415 420 425 

CTC AAC GGT CCG GTC GAG ATC CGC TGC TGC GGG CTC GAT CAG GCA GCC 1347 
Leu Asn Gly Pro Val Glu He Arg Cys Cys Gly Leu Asp Gin Ala Ala 
430 435 ~ 440 
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GAC GTC AAG 6TG CCG TCG GTG GGC CC6 CCG ACC ATC TCG GCG ACC CGT 1395 
Asp Val Lys Val Pro Ser Val Gly Pro Pro Thr lie Ser Ala Thr Arg 
445 450 455 

5 

CCG CGT CCG GAT CAT CCG GAC TGG GAC GTC GCG ATC TGG CTG AAC GTT 1443 
Pro Arg Pro Asp His Pro Asp Trp Asp Val Ala He Trp Leu Asn Val 
460 465 470 

CTC GGT GTT CCG GGC ACC CCC GGC ATG TTC GAG TTC TAC CGC GAG ATG 1491 
10 Leu Gly Val Pro Gly Thr Pro Gly Met Phe Glu Phe Tyr Arg Glu Met 

475 480 485 

GAG CAG TGG ATG CGG AGC CAC TAC AAC AAC GAC GAC GCC ACC TTC CGG 1539 
Glu Gin Trp Met Arg Ser His Tyr Asn Asn Asp Asp Ala Thr Phe Arg 
490 495 500 505 

15 

CCC GAG TGG TCG AAG GGG TGG GCG TTC GGT CCC GAC CCG TAC ACC GAC 1587 
Pro Glu Trp Ser Lys Gly Trp Ala Phe Gly Pro Asp Pro Tyr Thr Asp 
510 515 520 

AAC GAC ATC GTC ACG AAC AAG ATG CGC GCC ACC TAC ATC GAA GGT GTC 1635 
20 Asn Asp He Val Thr Asn Lys Met Arg Ala Thr Tyr lie Glu Gly Val 

525 - - - - 530 ~ • 535 

CCG ACG ACC GAG AAC TGG GAC ACC GCG CGC GCT CGG TAC AAC CAG ATC 1683 
Pro Thr Thr Glu Asn Trp Asp Thr Ala Arg Ala Arg Tyr Asn Gin He 
540 545 550 

25 

GAC CCG CAT CGC GTG TTC ACC. AAC GGA TTC ATG GAC AAG CTG CTT CCG 1731 
Asp Pro His Arg Val Phe Thr Asn Gly Phe Met Asp Lys Leu Leu Pro 
555 560 565 

30 

(2) INFORMATION ZU SEQ ID NO: 29: 

(i) SEQUENZ CHARAKTERISTIKA: 

35 (A) LANGE: 569 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

40 (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29: 
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Met Val Met His HJLs Gly His Ala Ser Thr Gly Pro Val Ala Pro Leu 
15 10 15 

Pro Thr Pro Pro Asn Phe Pro Asn Asp He Ala Leu Phe Gin Gin Ala 
20 25 30 



10 



Tyr Gin Asn Trp Ser Lys Glu He Met Leu Asp Ala Thr Trp Val Cys 
35 40 45 

Ser Pro Lys Thr Pro Gin Asp Val Val Arg Leu Ala Asn Trp Ala His 
50 55 60 



15 



Glu His Asp Tyr Lys He Arg Pro Arg Gly Ala Met His Gly Trp Thr 

65 70 75 80 

Pro Leu Thr Val Glu Lys Gly Ala Asn Val Glu Lys Val He Leu Ala 

85 90 " 95 
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Asr> Thr Met Thr His Leu Asn Gly lie Thr Val Asn Thr Gly Gly Pro 
100 105 HO 

Val Ala Thr Val Thr Ala Gly Ala Gly Ala Ser He Glu Ala He Val 
115 120 125 

Thr Glu Leu Gin Lys His Asp Leu Gly Trp Ala Asn Leu Pro Ala Pro 
130 135 140 

Gly Val Leu Ser He Gly Gly Ala Leu Ala Val Asn Ala His Gly Ala 
145 150 155 160 

Ala Leu Pro Ala Val Gly Gin Thr Thr Leu Pro Gly His Thr Tyr Gly 
165 170 175 

Ser Leu Ser Asn Leu Val Thr Glu Leu Thr Ala Val Val Trp Asn Gly 
180 185 190 

Thr Thr Tyr Ala Leu Glu Thr Tyr Gin Arg Asn Asp Pro Arg He Thr 
195 200 205 

Pro Leu Leu Thr Asn Leu Gly Arg Cys Phe Leu Thr Ser Val Thr Met 
211) 215 220 . _ 

Gin Ala Gly Pro Asn Phe Arg Gin Arg Cys Gin Ser Tyr Thr Asp He 
225 230 235 240 

Pro Trp Arg Glu Leu Phe Ala Pro Lys Gly Ala Asp Gly Arg Thr Phe 
245 250 255 

Glu Lys Phe Val Ala Glu Ser Gly Gly Ala Glu Ala lie Trp Tyr Pro 
260 265 270 

Phe Thr Glu Lys Pro Trp Met Lys Val Trp Thr Val Ser Pro Thr Lys 
275 260 285 

Pro Asp Ser Ser Asn Glu Val Gly Ser Leu Gly Ser Ala Gly Ser Leu 
290 295 300 

Val Gly Lys Pro Pro Gin Ala Arg Glu Val Ser Gly Pro Tyr Asn Tyr 
305 310 315 320 

He Phe Ser Asp Asn Leu Pro Glu Pro He Thr Asp Met He Gly Ala 
325 330 335 

He Asn Ala Gly Asn Pro Gly He Ala Pro Leu Phe Gly Pro Ala Met 
340 345 350 

Tyr Glu He Thr Lys Leu Gly Leu Ala Ala Thr Asn Ala Asn Asp He 
355 360 365 

Trp Gly Trp Ser Lys Asp Val Gin Phe Tyr He Lys Ala Thr Thr Leu 
370 375 380 

Arg Leu Thr Glu Gly Gly Gly Ala Val Val Thr Ser Arg Ala Asn lie 
385 390 395 400 

Ala Thr Val He Asn Asp Phe Thr Glu Trp Phe His Glu Arg He Glu 
405 410 415 

Phe Tyr Arg Ala Lys Gly Glu Phe Pro Leu Asn Gly Pro Val Glu He 
420 425 430 
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Arg Cys Cys Gly Leu Asp Gin Ala Ala Asp Val Lys Val Pro Ser Val 
435 440 445 

Gly Pro Pro Thr lie Ser Ala Thr Arg Pro Arg Pro Asp His Pro Asp 
450 455 460 

Trp Asp Val Ala lie Trp Leu Asn Val Leu Gly Val Pro Gly Thr Pro 
465 470 475 480 

Gly Met Phe Glu Phe Tyr Arg Glu Met Glu Gin Trp Met Arg Ser His 
485 490 495 

Tyr Asn Asn Asp Asp Ala Thr Phe Arg Pro Glu Trp Ser Lys Gly Trp 
500 505 510 

Ala Phe Gly Pro Asp Pro Tyr Thr Asp Asn Asp lie Val Thr Asn Lys 
515 520 525 

Met Arg Ala Thr Tyr He Glu Gly Val Pro Thr Thr Glu Asn Trp Asp 
530 535 540 

Thr Ala Arg Ala Arg Tyr Asn Gin He Asp Pro His Arg Val Phe Thr 
545 _ 550 555 560 

Asn Gly Phe Met Asp Lys Leu Leu Pro 
565 



(2) INFORMATION ZU SEQ ID NO: 30: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 36 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30: 



TCGCATGCCT CGACGGGCCC GGTGGCGCCG CTTCCG 



(2) INFORMATION ZU SEQ ID NO: 31: 
(j) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31: 



CGTGCTTCTG CAGTTCGGTG ACGAT 



(2) INFORMATION ZU SEQ ID NO: 32: 
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(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 39 Basenpaare 

(B) ART: Nukleinsaure- 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 

TCCCATGGCA CACAGGAAAC ATCGATGACC ATGATTACG 39 

(2) INFORMATION ZU SEQ ID NO: 33: 
(i) SEQUENZ CHARAKTERISTIKA: 



(A) LANGE: 25 Basenpaare 

(B) ART: Nukleinsaure 

20 (C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 
CGTGCTTCTG CAGTTCG6TG ACGAT 25 



(2) INFORMATION ZU SEQ ID NO: 34: 
(i) SEQUENZ CHARAKTERISTIKA: 



(A) LANGE: 18 Basenpaare 

(B) ART: Nukleinsaure 

35 (C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 

40 

CGATGCACCA TGGGCATG 18 



45 Patentanspruche 

1. Aktive Cholesterinoxidase, dadurch gekennzeichnet, daft sie die in SEQ ID NO 2 gezeigte Aminosauresequenz 
aufweist. 

so 2. DNA, welche fur ein Peptid mit Cholesterinoxidase-Aktivitat kodiert mit der in SEQ ID N0 1 gezeigten DNA-Sequenz 
Oder der dazu komplementaren DNA-Sequenz. 

3. Verfahren zur Herstellung einer rekombinanten Cholesterinoxidase durch Transformation einer geeigneten Wirts- 
zelle mit einer DNA gemafc Anspruch 2 , welche in einem geeigneten Expressionssystem kloniert vorliegt, Kultivierung 

55 der transformierten Wirtszelien und Isolierung der exprimierten Cholesterinoxidase aus dem Zytoplasma der trans- 

formierten Zellen. 

4. Verfahren gemafi Anspruch 3, dadurch gekennzeichnet, daft die verwendeten DNA am 5'-Ende eine der in SEQ 
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ID NO 6, 8, 10, 12, 14 Oder 16 gezeigten Sequenzen aufweist. 

5. DNA gemafi Anspruch 2, dadurch gekennzeichnet, daft sie am 5*-Ende eine der in SEQ ID NO 6, 8, 10, 12, 14 
oder 16 gezeigten Sequenzen aufweist. 

5 

6. DNA gemaft Anspruch 5, dadurch gekennzeichnet, daft sie eine der in SEQ ID NO 18, 20, 22, 24, 26 oder 28 
gezeigten Sequenzen aufweist. 

7. Rekombinante Cholesterinoxidase, dadurch gekennzeichnet, daft sie von einer DNA gemaft Anspruch 2 kodiert 
10 wird und am N-terminalen Ende eine der in SEQ ID NO 7, 9, 11, 13, 15 oder 17 gezeigten Sequenzen aufweist. 

8. Rekombinante Cholesterinoxidase gemaft Anspruch 7, dadurch gekennzeichnet, daft sie eine der in SEQ ID NO 
21, 23, 25, 27 und 29 gezeigten Sequenzen aufweist. 

15 9. Verwendung einer rekombinanten Cholesterinoxidase gemaft einem der Anspruche 7 oder 8 in einem enzymatischen 
Test zur Bestimmung von Cholesterin. 



Claims 

20 

1. Active cholesterol oxidase, characterized in that it has the amino acid sequence shown in SEQ ID NO 2. 

2. DNA which codes for a peptide with cholesterol oxidase activity having the DNA sequence shown in SEQ ID NO 1 
or the DNA sequence which is complementary thereto. 

25 

3. Process for the production of a recombinant cholesterol oxidase by transformation of a suitable host eel! with a DNA 
as claimed in claim 2 which is present cloned in a suitable expression system, culturing the transformed host cells 
and isolating the expressed cholesterol oxidase from the cytoplasm of the transformed cells. 

30 4. Process as claimed in claim 3, characterized in that the DNA used has one of the sequences shown in SEQ ID 
NO 6, 8, 10, 12, 14 or 16 at the 5* end. 

5. DNA as claimed in claim 2, characterized in that it has one of the sequences shown in SEQ ID NO 6, 8, 10, 12, 
14 or 16 at the 5' end. 

35 

6. DNA as claimed in claim 5, characterized in that it has one of the sequences shown in SEQ ID NO 18, 20, 22, 24, 
26 or 28. 

7. Recombinant cholesterol oxidase, characterized in that it is coded by a DNA as claimed in claim 2 and has one 
40 of the sequences shown in SEQ ID NO 7, 9, 1 1 , 1 3, 1 5 or 1 7 at the N-terminal end. 

8. Recombinant cholesterol oxidase as claimed in claim 7, characterized in that it has one of the sequences shown 
in SEQ ID NO 21 , 23, 25, 27 or 29. 

45 9. Use of a recombinant cholesterol oxidase as claimed in one of the claims 7 or 8 in an enzymatic test for the 
determination of cholesterol. 



Revendications 

50 

1. Cholesterol oxydase active, caracterisee en ce qu'elle presente la sequence d'acides amines representee dans 
SEQ ID NO: 2. 

2. ADN qui code pour un peptide possedant une activite de cholest6rol oxydase comprenant la sequence d'ADN 
55 representee dans SEQ ID NO: 1 ou la sequence d'ADN complementaire a celle-ci. 

3. Proc6d§ pour la preparation d'une cholesterol oxydase recombinante par transformation d'une cellule note appro- 
priee avec un ADN selon la revendication 2, qui est present a Tetat clone dans un systeme d'expression approprie, 
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par mise en culture des cellules notes transformees et par isolation de la cholesterol oxydase exprimee a partir du 
cytoplasme des cellules transformees. 

4. Precede selon la revendication 3, caracterise en ce que I'ADN utilise presente, a I'extremite 5', une des sequences 
5 representees dans SEQ ID NO: 6, 8, 10, 12, 14 ou 16. 

5. ADN selon (a revendication 2, caracterise en ce qu'il presente, a son extremite 5\ une des sequences representees 
dans SEQ ID NO: 6, 8, 10, 12, 14 ou 16. 

10 6. ADN selon la revendication 5, caracterise en ce qu'il presente une des sequences representees dans SEQ ID 
NO: 18, 20, 22,24, 26 ou 28. 

7. Cholesterol oxydase recombinante, caracterisee en ce qu'elle est encodee par un ADN selon la revendication 2 
et en ce qu'elle presente, a son extremite amino terminale, une des sequences representees dans SEQ ID NO: 7, 

15 9,11, 13,15ou 17. 

8. Cholesterol oxydase recombinante selon la revendication 7, caracterise en ce qu'elle presente une des sequences 
representees dans SEQ ID NO: 21 , 23, 25, 27 et 29. 

20 9. Utilisation d'une cholesterol oxydase recombinante selon Tune quelconque des revendications 7 ou 8, dans un test 
enzymatique pour la determination de cholesterol. 
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Figur 1 
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Figur 2 
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Pigur 3 
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Figur 4 
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(57) Abstract: 

NEW MATERIALCompounds of formula I (R^ is H or 
methyl; One of R 2 and R 3 is H and the other is OH). 

EXAMPLE: 

2-0-Benzyl-3,4,6-tri-0-acetyl-5-0-trimethylsilyl-D-allono 
nitrile, 

USE: A glycosidase inhibitor. 

PREPARATION: A ribofuranoside derivative of formula II 
[One of R 4 and R 5 is H and the other is alkoxy or 
formula III (X is R, CH 3 , OCH 3 or CI); One of R 6 and 
R 7 is H and the other is acyloxy, etc.; R 8 is acyloxy, 
etc.; R 9 is acyloxy, azide, etc.] and an 
arabinofuranoside derivative ire reacted with 
cyanotrimethylsilane in the presence of a Lewis acid and 
the resultant compound is then subjected to ring opening 
and carbon increase to obtain a compound of formula IV. 
The trimethylsilyl group of the resultant compound is 
substituted for a suitable elimination group and the 
cyano group thereof is subjected to ring closure by 
reduction to obtain a compound of formula V. Protective 
groups of the obtained compound of formula V are 



COPYRIGHT: (C)1991,JPO&Japio 



o - c a 



-1- 



